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内 容 。 
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随 着 我 国 改革 开放 的 进一步 深化 ,高 等 教育 也 得 到 了 快速 发 展 , 各 地 高 校 紧 密 结合 
地 方 经 济 建设 发 展 需要 ,科学 运用 市 场 调 节 机 制 , 加 大 了 使 用 信息 科学 等 现代 科学 技术 
提升 改造 传统 学 科 专业 的 投入 力度 ,通过 教育 改革 合理 调整 和 配置 了 教育 资源 ,优化 了 
传统 学 科 专 业 ,积极 为 地 方 经 济 建设 输送 人 才 , 为 我 国 经 济 社会 的 快速 ,健康 和 可 持续 发 
展 以 及 高 等 教育 自身 的 改革 发 展 做 出 了 巨大 贡献 。 但 是 ,高 等 教育 质量 还 需要 进一步 提 
高 以 适应 经 济 社会 发 展 的 需要 ,不 少 高 校 的 专业 设置 和 结构 不 尽 合理 ,教师 队伍 整体 素 
质 吸 待 提高 ,人 才 培 养 模 式 .教学 内 容 和 方法 需要 进一步 转变 ,学 生 的 实践 能 力 和 创新 精 
神 吸 待 加 强 。 

教育 部 一 直 十 分 重视 高 等 教育 质量 工作 。2007 年 1 月 ,教育 部 下 发 了 《关于 实施 高 
等 学 校本 科教 学 质量 与 教学 改革 工程 的 意见 》, 计 划 实 施 “ 高 等 学 校本 科教 学 质量 与 教学 
改革 工程 (简称 “质量 工程 ')”, 通 过 专业 结构 调整 ,课程 教材 建设 .实践 教学 改革 ,教学 团 
队 建 设 等 多 项 内 容 , 进 一 步 深 化 高 等 学 校 教学 改革 ,提高 人 才 培 养 的 能 力 和 水 平 ,更 好 地 
满足 经 济 社会 发 展 对 高 素质 人 才 的 需要 。 在 贯彻 和 落实 教育 部 “质量 工程 ”的 过 程 中 ,各 
地 高 校 发 挥 师资 力量 强 、 办 学 经 验 丰 富 ,教学 资源 充裕 等 优势 ,对 其 特色 专业 及 特色 课程 
( 群 ) 加 以 规划 、 整 理 和 总 结 ,更 新 教学 内 容 \、 改 革 课 程 体系 ,建设 了 一 大 批 内 容 新 、 体 系 
新 、 方 法 新 、 手 段 新 的 特色 课程 。 在 此 基础 上 ,经 教育 部 相关 教学 指导 委员 会 专家 的 指导 
和 建议 ,清华 大 学 出 版 社 在 多 个 领域 精 选 各 高 校 的 特色 课程 ,分 别 规划 出 版 系列 教材 ,以 
配合 “质量 工程 ”的 实施 ,满足 各 高 校 教学 质量 和 教学 改革 的 需要 。 

为 了 深入 贯彻 落实 教育 部 (关于 加 强 高 等 学 校本 科教 学 工作 ,提高 教学 质量 的 若干 
意见 ) 精 神 ,紧密 配合 教育 部 已 经 启动 的 “高 等 学 校 教学 质量 与 教学 改革 工程 精品 课程 建 
设 工作 ”, 在 有 关 专 家 、 教 授 的 倡议 和 有 关 部 门 的 大 力 支持 下 ,我 们 组 织 并 成 立 了 “清华 大 
学 出 版 社 教材 编审 委员 会 "(以 下 简称 “ 编 委 会 ”) , 旨 在 配合 教育 部 制定 精品 课程 教材 的 
出 版 规划 ,讨论 并 实施 精品 课程 教材 的 编写 与 出 版 工作 。“ 编 委 会 ”成员 皆 来 自 全 国 各 类 
高 等 学 校 教学 与 科研 第 一 线 的 骨干 教师 ,其 中 许多 教师 为 各 校 相关 院 、 系 主管 教学 的 院 
长 或 系 主任 。 

按照 教育 部 的 要 求 ,“ 编 委 会 ”一 致 认为 .精品 课程 的 建设 工作 从 开始 就 要 坚持 高 标 
准 、 严 要 求 ,处 于 一 个 比较 高 的 起 点 上 ; 精品 课程 教材 应 该 能 够 反映 各 高 校 教 学 改革 与 课 
程 建 设 的 需要 ,要 有 特色 风格 有 创新 性 (新 体系 、 新 内 容 、 新 手段 、 新 思路 ,教材 的 内 容 体 


SN 


软件 测试 基础 教程 


系 有 较 高 的 科学 创新 .技术 创新 和 理念 创新 的 含量 ) .先进 性 (对 原 有 的 学 科 体系 有 实质 
性 的 改革 和 发 展 ,顺应 并 符合 21 世纪 教学 发 展 的 规律 ,代表 并 引领 课程 发 展 的 趋势 和 方 
向 )\ 示 范 性 (教材 所 体现 的 课程 体系 具有 较 广 泛 的 辐射 性 和 示范 性 ) 和 一 定 的 前 脆性。 
教材 由 个 人 申报 或 各 校 推荐 (通过 所 在 高 校 的 “ 编 委 会 ?成 员 推荐 ) ,经 “ 编 委 会 ”认真 评 
审 , 最 后 由 清华 大 学 出 版 社 审定 出 版 。 

目前 ,针对 计算 机 类 和 电子 信息 类 相关 专业 成 立 了 两 个 “ 编 委 会 ”, 即 “清华 大 学 出 版 
社 计 算 机 教材 编审 委员 会 ”和 ”清华 大 学 出 版 社 电子 信息 教材 编审 委员 会 ”。 推 出 的 特色 
精品 教材 包括 : 

(1) 21 世纪 高 等 学 校规 划 教材 。 计算 机 应 用 一 一 高 等 学 校 各 类 专业 ,特别 是 非 计算 
机 专业 的 计算 机 应 用 类 教材 。 

(2) 21 世纪 高 等 学 校规 划 教 材 . 计算 机 科学 与 技术 一 一 高 等 学 校 计算 机 相关 专业 
的 教材 。 

(3) 21 世纪 高 等 学 校规 划 教材 。 电子 信息 一 一 高 等 学 校 电子 信息 相关 专业 的 教材 。 

(4) 21 世纪 高 等 学 校规 划 教材 。 软件 工程 一 一 高 等 学 校 软件 工程 相关 专业 的 教材 。 

(5) 21 世纪 高 等 学 校规 划 教材 。 信息 管理 与 信息 系统 。 

(6) 21 世纪 高 等 学 校规 划 教材 。 财经 管理 与 应 用 。 

(7) 21 世纪 高 等 学 校规 划 教材 。 电子 商务 。 

(8) 21 世纪 高 等 学 校规 划 教材 。 物 联网 。 


清华 大 学 出 版 社 经 过 三 十 多 年 的 努力 ,在 教材 尤其 是 计算 机 和 电子 信息 类 专业 教材 
出 版 方面 树立 了 权威 品牌 ,为 我 国 的 高 等 教育 事业 做 出 了 重要 贡献 。 清 华 版 教材 形成 了 
技术 准确 内容 严 说 的 独特 风格 ,这 种 风格 将 延续 并 反映 在 特色 精品 教材 的 建设 中 。 


清华 大 学 出 版 社 教材 编审 委员 会 
联系 人 : 魏 江 江 
E-mail: weijj@tup. tsinghua. edu. cn 


1. ISTOB8@ 简介 


ISTQB8@ (International Software Testing Qualifications Board) 全 称 国 际 软件 测试 认 
证 委员 会 ,是 国际 唯一 权威 的 软件 测试 资质 认证 机 构 。ISTQB8 目前 拥有 47 个 分 会 , 覆 
盖 包 括 美国 、 德 国 、. 英 国法 国 . 印 度 等 在 内 的 70 个 国家 和 地 区 。 截 至 目前 全 球 范围 内 经 
过 ISTQB8 认 证 的 软件 测试 工程 师 已 超过 320 000 人 ,并 以 每 季度 超过 12 000 人 的 速度 
递增 ,使 得 ISTQB8 成 为 测试 行业 的 第 一 大 认证 机 构 , 在 整个 IT 行业 居 第 三 位 ( 仅 次 于 
PMI 和 ITIL) 。 

CSTQB(Chinese Software Testing Qualifications Board) 全 权 代 表 ISTQB8@ 在 授权 
区 域内 推广 ISTQB® 软 件 测试 工程 师 认 证 体系 ,认证 .管理 培训 机 构 和 考试 机 构 , 接 受 
ISTQB8 的 全 面 的 业务 指导 和 授权 。 


2. 编写 目的 


随 着 国内 对 软件 测试 重视 程度 的 不 断 提高 ,ISTQB8 初 级 认证 也 得 到 越 来 越 多 的 软 
件 企业 的 认可 , 且 成 为 软件 测试 人 员 从 事 软 件 测 试 工作 的 “上 岗 证 ”。 

目前 ,国内 针对 ISTQB8 初 级 认证 的 主要 参考 资料 是 ISTQB8 初 级 认证 大 纲 , 包 括 英 
文 版 本 和 中 文 版 本 ,以 及 一 些 零星 的 培训 资料 ,从 而 导致 许多 学 员 无 法 有 效 地 进行 
ISTQB8 初 级 认证 的 考 前 学 习 和 复习 。 

为 了 帮助 参加 ISTQB8 初 级 认证 考试 的 学 员 系 统 学 习 测 试 基础 知识 ,以 帮助 测试 人 
员 尽 快 掌握 国际 通用 的 软件 测试 知识 ,同时 推动 国内 软件 测试 行业 的 国际 化 和 标准 化 ， 
本 书 编者 一 起 编写 了 这 本 ISTQB8 初 级 认证 的 参考 书 。 本 书 完全 覆盖 了 ISTQB8 初 级 认 
证 大 纲 的 内 容 , 同 时 在 每 个 章节 中 罗列 了 相关 的 学 习 目 标 和 测试 术语 ,而 且 每 个 章节 后 
面 提供 了 针对 学 习 目 标的 模拟 题 和 参考 答案 ,以 方便 测试 人 员 更 好 地 进行 复习 和 学 习 。 


3. 本 书 结构 


本 书 共 6 个 章节 ,以 软件 测试 过 程 为 基础 ,详细 讲解 了 软件 测试 基础 知识 和 基本 概 
念 ,描述 了 每 个 测试 阶段 涉及 的 主要 测试 活动 .技术 和 方法 .工具 等 ,以 及 贯穿 于 整个 测 
试 生 命 周 期 的 测试 管理 活动 。 

第 1 章 软件 测试 生命 周期 :介绍 了 软件 测试 的 一 些 基 本 概念 ,包括 软件 测试 的 定 
义 和 目 的 ,引起 缺陷 的 主要 原因 ,测试 与 质量 的 关系 ;软件 测试 的 基本 原则 和 测试 基本 过 
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程 ; 以 及 测试 心理 学 是 如 何 影响 测试 成 功 的 。 

第 2 章 软件 生命 周期 中 的 测试 :主要 介绍 了 各 种 不 同 的 开发 模型 ,组 件 测试 .集成 
测试 .系统 测试 和 验收 测试 的 特点 ` 目 的 和 测试 环境 的 要 求 等 ;介绍 了 常见 的 测试 类 型 ; 
功能 测试 非 功能 测试 .结构 测试 和 与 变更 相关 的 测试 的 特点 及 区 别 ; 同 时 介绍 了 在 已 有 
软件 系统 上 进行 的 维护 测试 的 特点 ,以 及 什么 因素 会 影响 测试 深度 和 广度 。 

第 3 章 静态 技术 :主要 描述 了 静态 测试 的 主要 特点 ,正式 评审 主要 的 组 成 阶段 , 相 
关 的 角色 和 职责 ;描述 了 不 同 评审 类 型 之 间 的 特点 、 目 的 和 区 别 ; 以 及 静态 分 析 的 特点 和 
主要 发 现 的 缺陷 类 型 。 

第 4 章 ”测试 设计 技术 :主要 描述 了 测试 用 例 开发 过 程 和 测试 用 例 设计 的 不 同类 
型 ;详细 讲解 了 常见 的 黑 盒 测 试 设计 技术 原理 和 覆盖 率 分 析 ; 阐述 了 白 盒 测试 中 的 语句 
履 盖 和 判定 覆盖 基本 原理 和 覆盖 率 要 求 ; 讲 解 了 基于 经 验 的 测试 技术 的 特点 ,分 别 描述 
了 错误 推测 法 和 探索 性 测试 在 测试 实践 中 的 应 用 。 

第 5 章 测试 管理 :主要 描述 了 测试 团队 的 不 同 测试 独立 性 要 求 ,测试 过 程 中 涉及 
的 主要 管理 活动 ,包括 测试 计划 和 估算 、 测 试 过 程 监控 、 配 置 管理 ,风险 和 测试 ,缺陷 管 
理 等 。 

第 6 章 软件 测试 工具 :详细 描述 测试 过 程 中 涉及 的 主要 测试 工具 的 分 类 ,组 织 内 
引入 工具 的 主要 风险 和 收益 ,以 及 如 何 通过 试点 项 目 高 效 地 在 测试 团队 内 部 署 测试 
工具 。 


4. 作者 分 工 


本 书 作 者 郑 文 强 、 周 震 满 和 马 均 飞 共 同 承担 了 本 书 的 编写 和 评审 工作 ,他 们 是 国内 
最 早 参与 ISTQB8 活动 的 CSTQB 专家 组 成 员 , 也 是 国内 最 早 获得 ISTQB8 初 级 认证 证 
书 和 高 级 证 书 的 成 员 之 一 。 本 书 作 者 有 总 共 超 过 50 年 的 测试 工作 相关 经 验 , 他 们 对 
ISTQB8 软 件 测试 知识 体系 的 深入 理解 和 学 习 目标 的 诠释 ,确信 可 以 为 读者 带 来 不 一 样 
的 感觉 。 


5. 致谢 
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书 的 出 版 提供 了 诚恳 的 指导 和 宝贵 的 意见 。 同 时 ,特别 感谢 CSTQB 办 公 室 对 本 书 出 版 
的 大 力 支持 。 
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术语 
术 语 会 里 解 释 
可 能 会 导致 软件 组 件 或 系统 无 法 执行 其 定义 的 功能 
Bug/Defect/Fault 缺陷 的 瑕 六 , 例 如 错误 的 语句 或 变量 定义 。 如 果 在 组 件 或 
系统 运行 中 遇 到 缺陷 ,可 能 会 导致 运行 的 失败 
Error/Mistake 错误 人 为 的 产生 不 正确 结果 的 行为 
Failure 失效 组 件 /系统 与 预期 的 交付 、 服 务 或 结果 存在 的 偏差 
将 会 导致 负面 结果 的 因素 ,通常 表达 成 可 能 的 (负面 ) 
Risk 风险 影响 
Qlity 质量 组 件 、 系 统 或 过 程 满足 指定 需求 或 用 户 / 客 户 需要 及 
期 望 的 程度 
Debugging 调试 发 现 , 分 析 和 去 除 软件 失败 根源 的 过 程 
一 个 系统 或 者 系统 中 的 组 件 为 了 帮助 用 户 解 决 问题 
re 需求 或 者 达到 一 个 目的 所 需要 具备 的 条 件 或 者 能 力 。 通 
过 系统 或 者 系统 的 组 件 的 运行 以 满足 合同 .标准 、 规 
格 或 其 他 指定 的 正式 文档 定义 的 要 求 
对 产品 或 产品 状态 进行 的 评估 ,以 确定 与 计划 的 结果 
Review 评审 所 存在 的 误差 ,并 提供 改进 建议 。 例 如 ,管理 评审 、 非 
正式 评审 ,技术 评审 、 审 查 和 走 查 
为 特定 目标 或 测试 条 件 (例如 ,执行 特定 的 程序 路 径 ， 
Test Case 测试 用 例 或 是 验证 与 特定 需求 的 一 致 性 ) 而 制订 的 一 组 输入 
值 执 行人 口 条 件 、 预 期 结果 和 执行 出 口 条 件 
包括 了 所 有 软件 生命 周期 活动 的 过 程 , 有 静态 的 也 有 
i 测试 动态 的 。 涉 及 计划 、 准 备 和 对 软件 及 其 相关 工作 产品 
的 评估 ,以 发 现 缺 陷 来 判定 软件 或 软件 的 工作 产品 是 
否 满足 特定 需求 ,证 明 它们 是 否 符合 目标 
Test Objective 测试 目标 设计 和 执行 测试 的 原因 或 目的 
: 和 测试 套件 包含 了 软件 输入 值 和 前 提 条 件 所 有 可 能 组 
Exhaustive Testing 穷尽 测试 合 的 测试 方法 
Confirmation Testing 确认 测试 参见 re-testing 
Re-Testing 再 测试 重新 执行 上 次 失败 的 测试 用 例 ,以 验证 纠 错 的 正确 性 
和 利益 相关 者 达成 一 致 的 系列 通用 和 专门 的 条 件 ,来 
正式 定义 一 个 过 程 的 结束 点 。 出 口 准则 可 以 防止 将 
Exit Criteria 出 口 准则 没有 完成 的 任务 错误 地 看 成 已 经 完成 的 任务 。 测 试 
中 使 用 的 出 口 准 则 可 以 用 来 报告 和 计划 什么 时 候 可 
以 停止 测试 
Incident 事件 任何 有 必要 调查 的 事情 
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续 表 


术 语 


解 释 


Regression Testing 


测试 先前 测试 过 并 修改 过 的 程序 ,确保 更 改 没有 给 软 
件 其 他 未 改变 的 部 分 带 来 新 的 缺陷 。 软 件 修改 后 或 
使 用 环境 变更 后 要 执行 回归 测试 


Test Basis 


测试 依据 


能 够 从 中 推断 出 组 件 /系统 需求 的 所 有 文档 。 测 试用 
例 是 基于 这 些 文档 的 。 只 能 通过 正式 的 修正 过 程 来 
修正 的 文档 称 为 固定 测试 依据 


Test Condition 


测试 条 件 


组 件 /系统 中 能 被 一 个 或 多 个 测试 用 例 验 证 的 条 目 或 
事件 。 例 如 功能 .事务 、 特 性 ` 质 量 特性 或 者 结构 化 
元 素 


Test Coverage 


测试 覆盖 


参见 coverage 


Coverage 


覆盖 


用 于 确定 执行 测试 套件 所 能 覆盖 项 目的 程度 ,通常 用 
百分比 来 表示 


Test Data 


测试 数据 


在 测试 执行 之 前 存在 的 数据 (如 在 数据 库 中 ), 这 些 数 
据 与 被 测 组 件 / 系 统 相互 影响 


Test Execution 


测试 执行 


对 被 测 组 件 /系统 执行 测试 ,产生 实际 结果 的 过 程 


Test Log 


测试 日 志 


按时 间 顺 序 排列 的 有 关 测 试 执行 所 有 相关 细节 的 
记录 


Test Plan 


测试 计划 


描述 预期 测试 活动 的 范围 方法、 资源 和 进度 的 文档 。 
它 标识 了 测试 项 . 需 测试 的 特性 、 测 试 任务 、 任 务 负责 
人 ,测试 人 员 的 独立 程度 、 测 试 环境 、 测 试 设计 技术 、 
测试 的 进入 和 退出 准则 和 选择 的 合理 性 \ 需 要 紧急 预 
案 的 风险 ,是 测试 策划 过 程 的 一 份 记录 


Test Procedure 
Specification 


测试 规程 说 明 


规定 了 执行 测试 的 一 系列 行为 的 文档 。 也 称 为 测试 
脚本 或 手工 测试 脚本 


Testpolicy 


测试 方针 


描述 有 关 组 织 测试 的 原则 、 方 法 和 主要 目标 的 高 级 
文档 


Test Suite 


测试 套件 


用 于 被 测 组 件 /系统 的 一 组 测试 用 例 。 在 这 些 测试 用 
例 中 ,一 个 测试 的 出 口 条 件 通常 用 作 下 个 测试 的 人口 
条 件 


Test Summary Report 


测试 总 结 报告 


总 结 测试 活动 和 结果 的 文档 ,也 包括 对 测试 项 是 否 符 
合 退 出 准则 进行 的 评估 


Testware 


测试 件 


在 测试 过 程 中 产生 的 测试 计划 、 测 试 设计 和 执行 测试 
所 需要 的 人 工 制品 ,例如 文档 、 脚 本 、 输 入 、 预 期 结果 、 
安装 和 清理 步骤 、 文 件数 据 库 、 环 境 和 任何 在 测试 中 
使 用 的 软件 和 工具 


Error Guessing 


错误 推测 


一 种 测试 设计 技术 ,根据 测试 人 员 以 往 的 经 验 , 猜 测 
在 组 件 或 系统 中 可 能 出 现 的 缺陷 以 及 错误 ,并 以 此 为 
依据 来 进行 特殊 的 用 例 设 计 以 暴露 这 些 缺 陷 


Independence of 


Testing 


测试 独立 性 


职责 分 离 , 有 助 于 客观 地 进行 测试 
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(人 为 什么 需要 测试 


1.1.1 软件 系统 的 重要 性 


软件 无 处 不 在 ,软件 系统 越 来 越 成 为 人 们 生活 中 不 可 或 缺 的 部 分 。 从 商业 应 用 到 消 
费 产 品 各 个 领域 ,人 们 在 享受 软件 系统 给 生活 带 来 的 便利 的 同时 ,也 承担 着 软件 缺陷 所 
带 来 的 不 良 后 果 。 软 件 的 不 正确 执行 可 能 会 引发 许多 问题 ,包括 资金 损失 时间 浪费 和 
商业 信誉 的 丧失 等 ,甚至 导致 人 身 伤害 和 死亡 。 

由 软件 缺陷 所 导致 的 事故 在 人 们 的 生活 中 并 不 少见 ,例如 大 家 耳熟能详 的 “千年 虫 ” 
冲击 波 事故 ; 网 站 承受 不 了 大 量 用 户 访问 而 导致 的 崩溃 事故 ; ATM 由 于 提 款 机 内 部 软 
件 缺 陷 导 致 用 户 提 款 操作 失败 ,但 是 账户 上 的 余额 却 被 意外 扣除 的 事故 ; 还 有 大 家 非常 
熟悉 的 手机 ,由 于 手机 软件 缺陷 导致 手机 经 常 死机 或 者 通话 中 断 的 现象 比比 丝 是 。 软 件 
缺陷 不 仅 影 响 了 用 户 的 正常 使 用 ,而 且 一 定 程度 上 降低 了 商家 的 信誉 度 。 可 见 , 日 常生 
活 中 软件 缺陷 无 处 不 在 ,由 它 导 致 的 不 良 后 果 也 在 时 刻 影响 着 人 们 生活 的 方方面面 , 因 
此 ,软件 测试 的 重要 性 不 容 忽视 。 

2013 年 美国 联邦 政府 的 在 线 保险 网 站 已 经 成 为 IT 领域 出 错 的 一 个 典型 事件 。 这 次 
事件 不 单单 是 一 次 简单 的 停机 事件 。 该 故障 导致 了 一 系列 的 硬 中 断 和 软 中 断 , 最 终 使 该 
网 站 的 功能 几乎 全 部 丧失 。 联 邦 政府 曾 尝试 增加 更 多 硬件 设施 来 做 弥补 ,但 该 网 站 从 12 
月 初 开 始 出 现 问题 ,直到 奥巴马 政府 的 "IT 团队 ?正确 定位 软件 和 解决 数据 瓶颈 时 才 恢复 
其 功能 。 之 后 ,又 通过 正式 成 立 医疗 改革 法 案 以 及 政治 审查 ,该 网 站 的 性 能 才 趋 于 完备 。 
恢复 之 后 的 网 站 在 一 些 会 导致 系统 崩溃 的 关键 点 上 加 强 了 防备 。? 


1.1.2 引起 软件 缺陷 的 原因 


所 有 的 人 都 会 犯错 误 , 因 此 由 人 设计 的 代码 .系统 和 文档 中 都 可 能 引入 缺陷 。 当 执 
行 存在 缺陷 的 代码 时 ,系统 就 可 能 无 法 执行 期 望 的 指令 (或 者 做 了 不 应 该 执行 的 指令 )， 
从 而 引起 软件 失效 。 虽 然 软件 .系统 和 文档 中 的 缺陷 可 能 会 引起 失效 ,但 并 不 是 所 有 的 
缺陷 都 会 引起 失效 。 

测试 过 程 中 经 常会 碰 到 软件 相关 的 问题 ,不 同 的 人 对 问题 的 称呼 也 不 同 ,例如 错误 
(Mistake/Error) .缺陷 (Fault/Defect/Bug) 、 失 效 (Failure) 等 。 这 些 术 语 , 虽 然 在 平时 讨 
论 的 时 候 , 可 能 有 共同 之 处 ,都 是 指 软件 中 存在 的 一 些 问 题 。 但 是 它们 的 具体 含义 和 定 
义 是 不 一 样 的 。ISTQB(International Software Testing Qualifications Board) 对 这 些 术 


@ http://server. zdnet. com. cn/server/2014/0103/3007608. shtml,2013 年 度 全 球 市 场 十 大 服务 器 宕 机 事件 . 
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语 的 定义 ,可 以 帮助 大 家 更 好 地 理解 它们 的 真正 含义 和 它们 之 间 的 相互 关系 。 

(1) 错误 : 人 为 的 产生 不 正确 结果 的 行为 。 

(2) 缺陷 : 可 能 会 导致 软件 组 件 或 系统 无 法 执行 其 定义 的 功能 的 甫 症 , 例 如 错误 的 
语句 或 变量 定义 。 如 果 在 组 件 或 系统 运行 中 遇 到 缺陷 ,可 能 会 导致 运行 的 失效 。 

(3) 失效 : 组 件 /系统 与 期 望 的 交付 、 服 务 或 结果 存在 的 偏差 。 失 效 是 缺陷 的 外 部 
反映 。 

从 上 面 的 定义 中 可 以 得 出 这 样 的 关系 : 人 为 的 错误 导致 一 个 不 正确 的 结果 ,这 个 不 
正确 的 结果 可 以 存在 于 代码 中 ,也 可 能 体现 在 文档 上 ,它们 被 称 为 缺陷 ; 而 内 在 的 缺陷 是 
人 为 错误 的 具体 表现 ,可 以 是 不 正确 的 文档 ,程序 段 .指令 或 数据 定义 ,它们 可 能 会 引起 
一 个 外 部 的 失效 。 失 效 是 执行 软件 时 缺陷 的 外 部 反映 ,如 图 1-1 所 示 。 


SR S % 
程序 员 犯 了 一 个 该 错误 在 代码 或 软件 运行 存在 缺陷 的 软件 或 代 


错误 (Mistake) 中 就 表现 为 缺陷 (Defect) 码 ， 就 可 能 引起 失效 (Failure) 


图 1-1 软件 失效 的 演变 过 程 


失效 除了 由 缺陷 造成 以 外 ,也 可 能 是 由 于 环境 条 件 引 起 的 。 放 射电 磁 辐 射 和 污 
染 等 都 有 可 能 引起 硬件 的 故障 ,或 者 由 于 硬件 条 件 的 改变 而 影响 软件 的 执行 ,从 而 导 
致 其 期 望 结果 与 实际 观察 到 的 结果 之 间 存 在 偏差 ,例如 系统 的 不 正确 反应 、 崩 溃 、 死 
机 等 。 

静态 测试 可 以 发 现 缺陷 ,而 动态 测试 发 现 的 是 失效 。 在 软件 开发 生命 周期 的 不 同 阶 
段 , 可 以 采用 不 同 的 技术 和 方法 来 发 现 软件 中 存在 的 缺陷 和 失效 。 例 如 ,在 开发 阶段 , 代 
码 和 设计 的 静态 评审 可 以 发 现 其 中 存在 的 缺陷 ; 而 在 动态 测试 过 程 中 ,通过 执行 测试 用 
例 可 以 发 现 可 能 的 失效 。 


1.1.3 测试 在 软件 开发 .维护 和 运行 中 的 角色 


软件 测试 是 软件 开发 生命 周期 中 关键 的 质量 保证 活动 之 一 。 实 施 严格 规范 的 测试 
有 助 于 发 现 软件 开发 过 程 中 不 同 阶 段 的 缺陷 , 尽 可 能 在 本 阶段 发 现 缺 陷 并 予以 修改 , 避 
免 将 缺陷 带 入 下 一 个 阶段 。 缺 陷 不 仅 具 有 雪 前 现象 (缺陷 放大 效应 ) ,并 且 发 现 缺 陷 越 
晚 ,修改 缺陷 的 成 本 也 越 高 。 所 以 在 软件 开发 过 程 中 ,测试 应 该 尽早 介入 。 

对 软件 系统 和 文档 进行 严格 的 测试 ,可 以 减少 软件 系统 在 运行 环境 中 的 风险 。 假 如 
在 软件 正式 发 布 之 前 发 现 和 修正 了 缺陷 ,就 可 以 提高 软件 系统 的 质量 。 进 行 软件 测试 也 
可 能 是 为 了 满足 合同 和 法 律 法 规 的 需求 ,或 者 是 为 了 满足 行业 标准 。 

软件 在 使 用 过 程 中 可 能 由 于 硬件 、 环 境 及 软件 自身 等 原因 出 现 各 种 问题 ,通过 测试 
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能 发 现 问题 ,或 者 通过 测试 模拟 可 能 出 现 的 问题 ,从 而 为 修复 缺陷 提供 必需 的 各 种 信息 。 
在 软件 的 维护 阶段 ,软件 测试 可 以 发 现 由 于 软件 修改 或 功能 增加 而 导致 的 问题 ,该 阶段 
的 测试 也 包括 对 文档 和 软件 系统 的 测试 。 

软件 测试 应 该 作为 开发 过 程 和 测试 过 程 改 进 的 重要 组 成 部 分 。 通 过 软件 测试 得 到 
的 项 目 信息 、 过 程 信息 以 及 其 他 的 一 些 测 试 结果 ,来 分 析 和 度量 测试 效率 和 产品 质量 。 
并 且 通 过 收集 和 分 析 过 程 中 得 到 的 数据 和 结果 ,制订 相应 的 改进 计划 和 活动 ,不 断 改 进 
软件 开发 过 程 和 测试 过 程 。 


1.1.4 测试 和 质量 


2001 年 ,软件 产品 质量 国际 标准 ISO/IEC 一 标准 9126 [ISO/IEC 9126] 正 式 发 布 ( 对 
应 的 国标 为 GB/T 16260) ,其 中 详细 定义 了 软件 质量 特性 ,包括 内 部 质量 、 外 部 质量 和 使 
用 质量 三 部 分 , 即 软 件 满足 规定 或 潜在 用 户 需 求 的 能 力 , 分 别 从 软件 内 部 、 外 部 和 使 用 中 
的 表现 三 个 方面 来 衡量 软件 的 质量 。 这 里 的 用户” 不 仅 指 真正 意义 上 的 外 部 用 户 , 即 购 
买 并 使 用 此 产品 的 独立 于 开发 方 和 测试 方 的 第 三 方 用 户 , 还 包括 “内 部 用 户 ”, 即 开发 人 
员 在 一 定 程度 上 是 设计 人 员 的 用 户 ,设计 人 员 要 考虑 到 开发 人 员 的 现 有 资源 和 开发 的 需 
求 ; 而 测试 人 员 在 一 定 程度 上 又 是 开发 人 员 的 用 户 , 开 发 人 员 也 应 考虑 到 这 一 部 分 用 户 
的 需求 。 另 一 方面 ,软件 质量 定义 中 的 “规定 的 需求 ”一 般 指 外 部 用 户 需求 中 精确 定义 
的 功能 、 性 能 以 及 开发 标准 等 需求 。 但 是 除 规定 的 需求 外 ,往往 有 一 些 隐 含 的 需求 没有 
提出 来 ,这 些 隐 含 的 需求 称 为 “潜在 的 需求 ”, 例 如 软件 产品 必须 具有 同类 产品 都 符合 的 
默认 的 行业 准则 。 

软件 的 产品 质量 可 以 通过 测试 软件 产品 的 内 部 属性 (典型 的 是 对 中 间 产 品 进行 的 静 
态 测试 ) ,也 可 以 通过 测试 软件 产品 的 外 部 属性 (典型 的 是 通过 测试 代码 执行 时 行为 的 动 
态 测试 ) ,或 者 通过 测量 软件 产品 的 使 用 质量 属性 来 评价 。 而 软件 产品 开发 的 过 程 质量 
的 提高 有 助 于 提高 产品 质量 ,而 产品 质量 的 提高 又 有 助 于 提高 使 用 质量 。 因 此 ,评估 和 
改进 过 程 是 提高 软件 产品 质量 的 一 种 有 效 手段 ,而 评价 和 改进 产品 质量 则 是 提高 使 用 质 
量 的 一 种 方法 。 同 样 , 评 价 使 用 质量 可 以 为 改进 产品 质量 提供 反馈 ,而 评价 产品 质量 可 
以 为 改进 过 程 提 供 反馈 。 它 们 之 间 的 关系 如 图 1-2 所 示 。 


过 程 软件 产品 软件 产品 的 使 用 


过 程 测度 内 部 测度 外 部 测度 使 用 质量 的 测度 
图 1-2 软件 生命 周期 中 的 质量 
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1. 内 部 质量 和 外 部 质量 


软件 产品 的 内 部 质量 和 外 部 质量 包括 相同 的 6 个 质量 特性 ,它们 分 别 是 功能 性 
(Functionality)、 可 靠 性 (Reliability)、 易 用 性 (Usability) 效率 (Efficiency)、 可 维护 性 
(Maintainability) 和 可 移植 性 (Portability) ,每 个 质量 特性 可 以 进一步 细 分 为 若干 个 不 同 
的 子 特性 ,如 图 1-3 所 示 。 


内 部 和 外 部 质量 
一 

性 | [柯达 性] 「 届 用 作 冯 素 ”| 「 可 各 护 作 | 可 移 本 你 

十 澡 性 | [成 关 全] [页 是 书信 | [机 癌 生性 [页 分 本 性 | [适应 征 

准确 性 | | 。 容错 性 “| | “易学 性 ”| | 资源 利用 性 | | 易 改 变性 | | 易 安装 性 
互 操作 性 | | 易 恢复 性 | | 易 操作 狂 | | 效率 依从 性 | | “稳定 性“| | 共存 性 
安全 保密 性 | | 可 靠 性 的 | | 吸引 性 易 测试 性 | | 易 葵 换 作 
功能 性 的 | | “依从 性 “| | 易 用 性 的 可 维护 性 的 | | 可 移植 性 的 

依从 性 依从 性 依从 性 依从 性 


图 1-3 内 部 质量 和 外 部 质量 的 质量 模型 


1) 功能 性 

功能 性 指 的 是 软件 产品 在 指定 条 件 下 使 用 时 ,软件 产品 提供 满足 明确 和 隐 含 要 求 的 
功能 的 能 力 。 功 能 性 主要 包含 以 下 子 特性 。 

(1) 适合 性 (Suitability) : 软件 产品 为 指定 的 任务 和 用 户 目 标 提供 一 组 合适 的 功能 
的 能 力 。 例 如 功能 或 者 操作 是 否 按 照 用 户 手 册 或 者 需求 说 明 中 规定 的 那样 执行 ,功能 或 
者 操作 是 否 提供 合理 的 和 可 接受 的 结果 以 实现 用 户 所 期 望 的 特定 目标 。 

(2) 准确 性 (Accuracy): 软件 产品 提供 具有 所 需 精 度 的 正确 或 者 相符 的 结果 或 者 效 
果 的 能 力 。 例 如 由 于 数据 精度 的 错误 导致 错误 的 计算 结果 ,在 运行 期 间 所 执行 的 任务 的 
实际 结果 与 预期 的 结果 有 差别 ,实际 的 操作 规程 与 操作 手册 上 描述 的 规程 不 一 致 。 

(3) 互 操 作 性 (Interoperability) : 软件 产品 与 一 个 或 者 更 多 的 规定 系统 之 间 进 行 交 
互 的 能 力 。 例 如 ,数据 和 命令 格式 ,在 软件 产品 和 与 之 相连 的 其 他 系统 之 间 是 否 易于 
传送 。 

(4) 安全 保密 性 (Security) : 软件 产品 保护 信息 和 数据 的 能 力 , 以 使 未 授权 的 人 员 或 
者 系统 不 能 阅读 或 者 修改 这 些 信息 和 数据 ,而 不 拒绝 授权 人 员 或 者 系统 对 它们 的 访问 。 
例如 ,未 能 防止 安全 保密 输出 信息 或 数据 的 泄漏 ; 未 能 防止 重要 数据 的 丢失 ; 未 能 防止 
非法 的 访问 或 者 非法 的 操作 。 

(5) 功能 性 的 依从 性 (Functionality Compliance) : 软件 产品 遵循 与 功能 性 相关 的 标 
准 、 约 定 或 者 法 规 以 及 类 似 规定 的 能 力 。 例 如 ,使 用 FTP 进行 文件 传输 的 软件 需要 符合 
FTP 的 协议 要 求 。 

2) 可 靠 性 

可 靠 性 指 的 是 在 指定 条 件 下 使 用 时 ,软件 产品 维持 规定 的 性 能 级 别 的 能 力 。 软 件 产 
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品 不 会 损耗 或 者 老化 ,因此 其 可 靠 性 的 局 限 是 由 于 需求 .设计 和 实现 中 的 缺陷 所 致 。 由 
这 些 缺 陷 引 起 的 失效 取决 于 软件 产品 的 使 用 方式 和 所 选择 的 程序 选项 ,而 不 是 经 过 的 时 
间 。 可 靠 性 主要 包含 以 下 子 特性 。 

(1) 成 熟 性 (Maturity): 软件 产品 为 避免 由 于 软件 中 的 故障 或 缺陷 而 导致 失效 的 
能 力 。 

(2) 容错 性 (Fault Tolerance) : 在 软件 出 现 故障 或 者 会 违反 其 指定 接口 的 情况 下 , 软 
件 产品 维持 规定 的 性 能 级 别 的 能 力 。 

(3) 易 恢 复 性 (Recoverability) : 在 失效 发 生 的 时 候 , 软 件 产品 重建 规定 的 性 能 级 别 
并 恢复 受 直接 影响 的 数据 的 能 力 。 

(4) 可 靠 性 的 依从 性 (Reliability Compliance) : 软件 产品 遵循 与 可 靠 性 相关 的 标准 、 
约定 或 法 规 的 能 力 。 

3) 易 用 性 

易 用 性 指 的 是 在 指定 条 件 下 使 用 时 ,软件 产品 被 理解 学习 、 使 用 和 吸引 用 户 的 能 
力 。 这 里 的 用 户 包括 操作 员 、 最 终 用 户 和 受 该 软件 的 使 用 影响 或 者 依赖 于 该 软件 使 用 的 
间接 用 户 。 易 用 性 必须 针对 软件 所 影响 的 所 有 不 同 的 用 户 环境 ,可 能 包括 对 使 用 的 准备 
和 结果 的 评价 。 易 用 性 主要 包含 以 下 子 特性 。 

(1) 易 理解 性 (Understandability) : 软件 产品 使 用 户 能 理解 软件 是 否 合适 以 及 如 何 
能 将 软件 用 于 特定 的 任务 和 使 用 条 件 的 能 力 。 例 如 ,用 户 如 何 利用 软件 产品 去 完成 一 项 
特殊 的 任务 。 

(2) 易学 性 (Learnability) : 软件 产品 使 用 户 能 学 习 其 应 用 的 能 力 。 例 如 ,用 户 需 要 
用 多 长 的 时 间 才 能 学 会 使 用 某 一 特殊 的 功能 。 

(3) 易 操 作 性 (Operability) : 软件 产品 使 用 户 能 操作 和 控制 它 的 能 力 。 

(4) 吸引 性 (Attractiveness) : 软件 产品 吸引 用 户 的 能 力 。 例 如 ,软件 产品 中 的 颜色 
使 用 和 图 形 化 设计 特征 是 否 吸 引用 户 。 

(5) 易 用 性 的 依从 性 (Usability Compliance): 软件 产品 遵循 与 易 用 性 相关 的 标准 、 
约定 、 风 格 指南 (Style Guide) 或 者 法 规 的 能 力 。 

4) 效率 

效率 指 的 是 在 规定 条 件 下 ,相对 于 所 用 的 资源 的 数量 ,软件 产品 可 提供 适当 性 能 的 
能 力 。 资 源 可 能 包括 其 他 软件 产品 、 系 统 的 软件 和 硬件 配置 ,以 及 其 他 相关 的 资源 (例如 
打印 纸 、 磁 盘 等 )。 效 率 主要 包含 以 下 子 特性 。 

(1) 时 间 特 性 (Time Behavior) : 在 规定 条 件 下 ,软件 产品 执行 其 功能 时 ,提供 适当 的 
响应 和 处 理 时 间 以 及 吞吐 量 的 能 力 。 例 如 ,用 户 申请 加 入 IGMP 组 播 组 的 响应 时 间 和 处 
理 时 间 。 

(2) 资源 利用 性 (Resource Utilization) : 在 规定 条 件 下 ,软件 产品 执行 其 功能 时 ,使 
用 合适 数量 和 类 别 的 资源 的 能 力 。 例 如 ,多 个 用 户 同 时 申请 加 入 IGMP 组 播 组 时 系统 的 
内 存 使 用 情况 。 
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(3) 效率 的 依从 性 (Efficiency Compliance): 软件 产品 遵循 与 效率 相关 的 标准 或 者 
约定 的 能 力 。 

5) 可 维护 性 

可 维护 性 指 的 是 软件 产品 可 被 修改 的 能 力 , 这 里 的 修改 包括 纠正 改进 或 者 软件 对 
环境 .需求 和 功能 说 明 变 化 的 适应 能 力 。 可 维护 性 主要 包含 以 下 子 特性 。 

(1) 易 分 析 性 (Analysability) : 与 为 诊断 缺陷 或 失效 原因 及 为 判定 待 修改 的 部 分 所 
需 努 力 有 关 的 软件 属性 。 例 如 , 当 试 图 诊断 缺陷 或 者 失效 的 原因 时 , 易 分 析 性 可 以 通过 
维护 者 或 者 用 户 的 工作 量 或 者 耗费 的 资源 来 测量 。 

(2) 易 改 变性 (Changeability) : 软件 产品 使 指定 的 修改 可 以 被 实现 的 能 力 。 实 现 包 
括 编码 设计 和 文档 的 更 改 。 易 改变 性 也 可 以 通过 维护 者 或 者 用 户 针对 修改 所 花 的 工作 
量 来 进行 测量 。 

(3) 稳定 性 (Stability) : 软件 产品 避免 由 于 软件 修改 而 造成 意外 结果 的 能 力 。 

(4) 易 测试 性 (Testability) : 软件 产品 使 已 修改 软件 能 被 确认 的 能 力 。 

(5) 可 维护 性 的 依从 性 (Maintainability Compliance) : 软件 产品 遵循 与 可 维护 性 相 
关 的 标准 、 规 范 或 者 约定 的 能 力 。 

6) 可 移植 性 

可 移植 性 指 的 是 软件 产品 从 一 种 环境 迁移 到 另外 一 种 环境 的 能 力 。 环 境 可 包括 组 
织 、 硬 件 或 者 软件 的 环境 。 可 移植 性 主要 包含 以 下 子 特 性 。 

(1) 适应 性 (Adaptability): 软件 产品 无 须 采 用 额外 的 活动 或 者 手段 就 可 以 适应 不 
同 指定 环境 的 能 力 。 例 如 ,适应 性 包括 内 部 容量 的 可 伸缩 性 (屏幕 域 , 表 、 报 告 格式 的 伸 
缩 性 ) 。 

(2) 易 安 装 性 (Installability) : 软件 产品 在 指定 环境 中 能 被 安装 的 能 力 。 

(3) 共存 性 (Co-Existence) : 软件 产品 在 公共 环境 中 同 与 其 分 享 公 共 资 源 的 其 他 独 
立 软件 共存 的 能 力 。 

(4) 易 蔡 换 性 (Replaceability) : 软件 产品 在 同样 环境 下 ,替代 另 一 个 相同 用 途 的 指 
定 软件 产品 的 能 力 。 软 件 产品 的 新 版 本 的 易 替 换 性 在 升级 时 对 用 户 而 言 是 非常 重 
要 的 。 

(5) 可 移植 性 的 依从 性 (Portability Compliance) : 软件 产品 遵循 与 可 移植 性 相关 的 
标准 或 者 约定 的 能 力 。 


2. 使 用 质量 


使 用 质量 指 的 是 软件 产品 使 指定 用 户 在 特定 的 使 用 环境 下 达到 满足 有 效 性 
(Effectiveness)、 生产率 (Productivity)、 安 全 性 (Safety) 以 及 满意 度 (Satisfaction) 要 求 的 
特定 目标 的 能 力 。 使 用 质量 是 基于 用 户 观 点 的 质量 ,使 用 质量 的 获得 依赖 于 取得 必需 的 
外 部 质量 ,而 外 部 质量 的 获得 则 依赖 于 取得 必需 的 内 部 质量 。 软 件 产品 的 使 用 质量 分 为 
4 个 质量 特性 ,它们 分 别 是 有 效 性 、 生 产 率 ,安全 性 和 满意 度 ,如 图 1-4 所 示 。 
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使 用 质量 


[ 
[用 性 |] [ 生产 素 | [ 安全 性 | [ 消 意 度 


图 1-4 使 用 质量 的 质量 模型 


(1) 有 效 性 : 软件 产品 在 指定 的 使 用 环境 下 ,使 用 户 达 到 与 准确 性 和 完备 性 相关 的 
规定 目标 的 能 力 。 

(2) 生产 率 : 软件 产品 在 指定 的 使 用 环境 下 ,使 用 户 为 达到 有 效 性 而 消耗 适当 数量 
的 资源 的 能 力 。 相 关 资 源 包括 完成 任务 的 时 间 、 用 户 的 工作 量 、 物 质 材料 和 使 用 的 财政 
支出 等 。 

(3) 安全 性 : 软件 产品 在 指定 的 使 用 环境 下 ,达到 对 人 类 业务 ,软件 .财产 或 者 环境 
造成 损耗 的 可 接受 的 风险 级 别 的 能 力 , 风 险 通 常 是 由 功能 性 、 可 靠 性 、 易 用 性 或 者 可 维护 
性 中 的 缺陷 所 致 。 

(4) 满意 度 : 软件 产品 在 指定 的 使 用 环境 下 ,使 用 户 满意 的 能 力 。 满 意 度 是 用 户 与 
产品 交互 的 反应 ,当然 还 包括 对 软件 产品 使 用 的 意见 。 

测试 人 员 的 一 项 重要 任务 是 通过 测试 提高 软件 质量 ,但 不 等 于 说 软件 测试 人 员 就 是 
软件 质量 保证 人 员 ,因为 测试 只 是 软件 质量 保证 工作 中 的 一 个 环节 。 软 件 质 量 保证 和 软 
件 测试 是 软件 质量 工程 的 两 个 不 同 层面 的 工作 。 

软件 质量 保证 的 重要 工作 是 通过 预防 ,检查 与 改进 来 保证 软件 质量 。 在 软件 质量 保 
证 活动 中 也 有 一 些 测试 活动 ,但 所 关注 的 是 软件 质量 的 检查 与 测量 。 软 件 质量 保证 的 工 
作 是 在 软件 生命 周期 中 管理 以 及 检查 软件 是 否 满足 规定 的 质量 和 用 户 的 需求 ,因此 主要 
着 眼 于 软件 开发 活动 中 的 过 程 . 步 又 和 产物 ,而 不 是 对 软件 进行 剖析 找 出 问题 或 进行 评 
估 。 和 软件 质量 保证 的 另 一 个 工作 是 建立 软件 质量 标准 .评审 过 程 和 方法 以 及 测试 过 程 ， 
同时 跟踪 、 审 计 和 评审 软件 开发 和 测试 过 程 中 发 现 的 问题 ,从 而 帮助 改进 开发 过 程 和 测 
试 过程 。 质 量 保证 包括 以 下 主要 工作 内 容 。 

(1) 建立 软件 质量 保证 活动 的 实体 。 

(2) 制订 软件 质量 保证 计划 。 

(3) 坚持 各 阶段 的 评审 和 审计 ,跟踪 其 结果 ,并 进行 合适 的 处 理 。 

(4) 监控 软件 产品 的 质量 。 

(5) 收集 和 分 析 软 件 质 量 保证 活动 的 数据 。 

(6) 度量 软件 质量 保证 活动 。 

软件 测试 关心 的 不 是 过 程 ,而 是 对 过 程 的 产物 以 及 开发 出 的 软件 产品 进行 剖析 。 测 
试 人 员 对 软件 产品 进行 动态 测试 ,对 过 程 中 的 工作 产品 ,例如 需求 文档 、 设 计 文 档 和 源 代 
码 进行 静态 测试 ,以 找 出 问题 ,从 而 评估 软件 产品 质量 。 测 试 人 员 必 须 假设 软件 存在 潜 
在 的 问题 ,测试 中 所 做 的 操作 是 为 了 找 出 更 多 的 问题 ,而 不 仅仅 是 为 了 验证 每 个 功能 或 
者 需求 条 目 是 否 正 确 。 对 测试 中 发 现 的 问题 的 分 析 、 跟 踪 与 回归 测试 也 是 软件 测试 中 的 
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重要 工作 。 软 件 测试 包括 以 下 主要 阶段 。 

(1) 测试 计划 和 控制 。 

(2) 测试 分 析 和 设计 。 

(3) 测试 实现 和 执行 。 

(4) 评估 出 口 准则 和 报告 。 

(5) 测试 结束 活动 。 

通过 测试 可 以 发 现 软件 系统 存在 的 缺陷 ,包括 功能 缺陷 和 非 功能 缺陷 , 当 测 试 发 现 
很 少 或 者 没有 发 现 缺陷 的 时 候 , 开 发 者 和 用 户 就 会 对 软件 的 质量 充满 信心 。 一 个 设计 正 
确 、 合 理 的 测试 完成 并 顺利 通过 ,可 以 降低 软件 系统 存在 问题 的 风险 。 而 对 测试 过 程 中 
发 现 的 缺陷 进行 修正 , 则 可 使 软件 系统 的 质量 提高 。 所 以 说 ,软件 测试 是 提高 软件 质量 
的 一 个 重要 手段 。 


1.1.5 测试 是 否 充分 


在 判断 测试 是 否 充 分 时 ,需要 考虑 风险 以 及 项 目 在 时 间 和 预算 上 的 限制 。 测 试 需要 
给 利益 相关 者 提供 足够 的 信息 ,帮助 他 们 决定 是 发 布 已 测 的 软件 或 系统 ,还 是 继续 进行 
下 阶段 的 测试 。 

测试 是 否 充分 ,或 者 说 什么 时 候 可 以 结束 测试 ,这 就 涉及 测试 出 口 准则 的 定义 。 在 
时 间 和 资源 有 限 的 条 件 下 ,要 进行 完全 测试 或 者 穷尽 测试 , 找 出 所 有 的 软件 缺陷 ,开发 出 
完美 的 软件 产品 ,几乎 是 不 可 能 的 。 

下 面 以 一 个 包含 简单 控制 流 的 小 程序 为 例 , 来 说 明 完 全 测试 或 者 穷尽 测试 几乎 是 不 
可 能 的 。 设 该 程序 由 4 个 嵌 套 的 连接 部 分 (IF 指令 ) 组 成 ,相应 的 控制 流 图 如 图 1-5 
所 示 。 


1-5 控制 流 图 


点 A 和 点 也 之 间 是 一 个 循环 .有 一 个 从 点 B 到 点 A 的 返回 。 如 果 要 使 程序 在 基于 
控制 流 的 各 种 不 同 可 能 性 下 得 到 完全 的 测试 ,那么 必须 执行 每 个 可 能 的 连接 组 合 。 假 设 
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循环 的 上 限 是 20 次 并 且 所 有 的 连接 都 是 独立 的 , 则 可 以 用 以 下 计算 方法 得 出 测试 用 例 
数量 : 5 十 59 十 58 十 57 十 … 十 51。 

其 中 5 是 循环 中 可 能 的 执行 路 径 数 目 。 执 行 循环 中 的 每 一 个 可 能 路 径 得 到 5 个 测 
试用 例 , 每 个 测试 用 例 都 不 返回 到 循环 的 起 始点 。 如 果 执 行 的 测试 用 例 结果 返回 到 循环 
起 始点 , 则 必须 考虑 5X5 一 25 个 不 同 的 执行 可 能 性 ,以 此 类 推 。 由 此 可 见 ,根据 上 面 计 
算 的 结果 ,存在 大 约 119 209 289 550 780 种 不 同 的 程序 序列 。 

假设 通过 人 工 的 方式 来 完成 测试 ,一 个 测试 用 例 需 要 耗费 5min 来 进行 准备 .执行 和 
分 析 , 则 针对 该 程序 的 测试 所 要 耗费 的 时 间 将 是 十 亿 年 。 如 果 用 5ps 来 代替 5min, 通 过 
自动 的 方式 来 运行 测试 ,那么 测试 仍然 需要 持续 19 年 。 

可 见 , 即 使 一 个 规模 很 小 的 软件 ,其 路 径 排列 组 合 的 数量 也 是 非常 庞大 的 。 在 实际 
操作 中 ,对 这 么 小 的 程序 进行 穷尽 测试 都 是 几乎 不 可 能 完成 的 。 事实 上 软件 测试 在 一 定 
程度 上 是 一 个 随机 抽样 的 过 程 ,测试 人 员 只 可 能 考虑 所 有 可 以 想象 的 测试 用 例 中 的 一 部 
分 。 受 时 间 和 资源 的 限制 ,在 测试 中 不 可 能 运行 路 径 中 的 每 一 种 组 合 。 那 么 到 底 多 少 测 
试 才 算是 充分 的 ,或 者 说 如 何 定义 测试 的 出 口 准则 呢 ? 在 实际 的 项 目测 试 中 ,可 以 从 以 
下 几 方 面 来 考虑 。 

(1) 当 计 划 的 测试 时 间 用 尽 的 时 候 。 

(2) 当 继 续 测试 没有 发 现 新 的 缺陷 时 。 

(3) 当 所 有 的 测试 用 例 执行 完毕 时 。 

(4) 当 测 试 的 成 本 大 于 测试 的 收益 时 。 

(5) 当 达 到 所 要 求 的 测试 获 盖 率 时 。 

(6) 当 所 有 已 发 现 的 缺陷 都 已 经 被 清除 时 。 

在 出 现 上 述 的 某 种 或 多 种 情况 的 组 合 时 ,就 可 以 认为 满足 了 测试 的 出 口 准则 ,从 而 
考虑 结束 测试 。 


(1.2 什么 是 测试 


在 工业 制造 和 生产 中 ,测试 被 当 作 一 个 常规 的 检验 产品 质量 的 生产 活动 ,其 含义 为 
“以 检验 产品 是 否 满足 需求 为 目标 ”>。 对 于 软件 测试 行业 来 说 ,根据 测试 目的 的 不 同 ,会 
有 不 同类 型 的 软件 测试 的 定义 .@ 下 面 是 几 个 典型 的 软件 测试 定义 。 

1.2.1 验证 软件 的 正确 性 

测试 的 目的 是 验证 软件 产品 是 否 能 够 工作 。 此 时 ,测试 和 调试 已 经 正式 区 别 开 来 。 


@ David Gelperin and Bill Hetzel，the growth of software testing, June 1988，Volume 31, Number 6， 


Communications of ACM. 
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按照 该 测试 定义 ,测试 人 员 在 测试 过 程 中 ,就 会 存 有 这 样 的 想法 : 为 了 能 够 看 到 产品 可 以 
工作 ,可 以 将 测试 工作 往 后 推迟 。 测 试 活 动 始终 落后 于 开发 活动 ,测试 通常 被 认为 是 软 
件 开 发 生命 周期 中 处 于 编码 之 后 的 一 项 活动 。 

这 个 观念 的 主要 代表 人 物 是 Bill Hetzel 博士 。 他 于 1972 年 在 美国 的 北 卡罗来纳 大 
学 组 织 了 历史 上 第 一 次 正式 的 关于 软件 测试 的 会 议 。1973 年 他 首先 给 出 软件 测试 的 定 
义 : “测试 就 是 建立 一 种 信心 ,确信 程序 能 够 按期 望 的 设想 进行 "。1983 年 他 又 将 软件 测 
试 的 定义 修改 为 :“ 评 价 一 个 程序 和 系统 的 特性 或 能 力 , 并 确定 它 是 否 达 到 期 望 的 结果 。 
软件 测试 就 是 以 此 为 目的 的 任何 行为 ”。 在 这 个 定义 中 ,“ 设 想 ”" 和 “期 望 的 结果 ”就 是 人 
们 现在 所 说 的 用 户 需 求 。 同 时 他 把 软件 的 质量 定义 为 符合 要 求 ,其 中 的 核心 思想 为 : 测 
试 是 试图 验证 软件 是 工作 的 , 即 软件 的 功能 是 按照 预先 的 设计 执行 的 ,以 正 向 思维 ,针对 
系统 的 所 有 功能 ,逐个 验证 其 正确 性 。 

测试 目的 为 确信 产品 能 够 工作 ,可 以 简单 抽象 地 描述 为 这 样 的 过 程 : 在 设计 规定 的 
环境 下 运行 软件 ,将 其 结果 与 用 户 需 求 相 比较 ,如 果 相 符 则 测试 通过 ,如 果 不 相符 则 视 为 
存在 缺陷 。 这 一 过 程 的 终极 目标 是 将 软件 的 所 有 功能 在 所 有 设计 规定 的 环境 中 全 部 运 
行 , 确 认 这 些 功 能 的 正确 性 。 这 类 测试 方法 以 需求 和 设计 为 本 ,因此 有 利于 界定 测试 工 
作 的 范畴 ,更 利于 部 署 测 试 的 侧重 点 、 加 强 针 对 性 。 这 一 点 对 于 大 型 软件 的 测试 ,尤其 是 
在 有 限 的 时 间 和 人 力 资 源 情况 下 显得 格外 重要 。 


1.2.2 发 现 软件 中 的 缺陷 


前 面 定义 的 测试 的 目的 是 确信 软件 产品 能 够 正常 工作 ,这 一 观点 受到 很 多 业界 权威 
的 质疑 和 挑战 。 其 中 的 一 个 代表 人 物 是 Glenford J. Myers, 他 认为 测试 不 应 该 着 眼 于 验 
证 软件 是 可 以 正常 工作 的 ,相反 应 该 首先 假设 软件 是 存在 错误 和 缺陷 的 ,然后 用 逆向 思 
维 去 发 现 尽 可 能 多 的 缺陷 。2? 他 也 认为 ,将 “验证 软件 是 可 以 工作 的 ”作为 测试 目的 ,非常 
不 利于 测试 人 员 发 现 软件 中 的 缺陷 。1979 年 ,Glenford J. Myers 给 出 了 他 对 软件 测试 
的 定义 :“ 测 试 是 为 发 现 错误 而 执行 一 个 程序 或 者 系统 的 过 程 . ”同时 ,Myers 还 提出 了 以 
下 三 个 重要 观点 。 

(1) 测试 是 为 了 证 明 程序 有 错 , 而 不 是 证 明 程 序 无 错误 。 

(2) 一 个 好 的 测试 用 例 在 于 它 能 发 现 以 前 未 发 现 的 错误 。 

(3) 一 个 成 功 的 测试 是 发 现 了 以 前 未 发 现 的 错误 的 测试 。 

这 个 测试 目的 ,简单 地 说 就 是 验证 软件 是 有 错误 的 。Myers 认为 ,一 个 成 功 的 测试 
必须 是 发 现 缺陷 的 测试 ,不 然 就 没有 价值 。 这 就 如 同 病 人 (假定 此 人 确实 有 病 ) 到 医院 做 
医疗 检查 ,结果 各 项 指标 都 正常 , 那 说 明 该 项 医疗 检查 对 于 诊断 该 病人 的 病情 是 没有 价 
值 的 ,是 失败 的 。 


@ Myers, G.J. The Art of Software Testing. John Wiley & Sons, New York: 1979. 
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Myers 提出 的 “测试 的 目的 是 证 伪 ” 这 一 概念 ,推翻 了 过 去 “为 表明 软件 正确 而 进行 
测试 ?的 理解 ,为 软件 测试 的 发 展 提出 了 新 的 方向 ,软件 测试 的 理论 方法 在 这 之 后 也 得 到 
了 长 足 的 发 展 。 这 个 定义 ,强调 了 测试 人 员 不 断 思考 开发 人 员 可 能 存在 的 理解 误区 和 不 
良 习惯 等 ,从 而 来 发 现 系统 中 存在 的 各 种 各 样 的 问题 。 这 种 方法 往往 能 够 更 多 地 发 现 系 
统 中 存在 的 缺陷 。 

然而 ,对 Glenford Myers 先生 “测试 的 目的 是 证 伪 ” 这 一 概念 的 理解 也 不 能 太 过 于 片 
面 。 在 很 多 软件 工程 学 、 软 件 测试 方面 的 书籍 中 都 提 到 这 样 一 个 概念 :“ 测 试 的 目的 是 寻 
找 缺 陷 , 并 且 是 尽 最 大 可 能 找 出 最 多 的 缺陷 ”"。 这 很 容易 让 人 们 认为 测试 人 员 就 是 “ 挑 毛 
病 ” 的 ,而 由 此 带 来 如 下 诸多 问题 。 

(1) 若 测试 人 员 以 发 现 缺 陷 为 唯一 目标 ,而 很 少 去 关注 系统 对 需求 的 实现 ,测试 活动 
往往 会 存在 一 定 的 随意 性 和 盲目 性 ,例如 缺乏 对 系统 需求 的 测试 覆盖 率 。 

(2) 若 测试 人 员 被 定位 为 “ 挑 毛病 ”这样 的 角色 , 则 容易 和 开发 人 员 产 生 矛 盾 ,导致 沟 
通 时 存在 较 多 的 冲突 。 

(3) 若 企业 或 者 组 织 接受 了 这 样 的 方法 ,以 缺陷 数量 作为 考核 测试 人 员 业 绩 的 唯一 
指标 ,可 能 会 带 来 一 定 的 负面 影响 。 

测试 目的 为 "证 明 程 序 有 缺陷 ?的 测试 方法 与 需求 和 设计 没有 必然 的 关联 ,更 强调 
测试 人 员 发 挥 主观 能 动 性 ,用 逆向 思维 方式 ,不 断 思 考 开发 人 员 理解 的 误区 、` 不 良 的 习 
惯 .程序 代码 的 边界 、 无 效 数据 的 输入 以 及 系统 的 各 种 弱点 ,试图 破坏 系统 、 捧 毁 系统 ， 
其 目标 就 是 发 现 系 统 中 各 种 各 样 的 问题 。 这 种 方法 往往 能 够 发 现 系 统 中 存在 的 更 多 
缺陷 。 


1.2.3 IEEE 给 出 的 定义 


随 着 软件 和 IT 行业 的 蓬勃 发 展 ,软件 趋向 大 型 化 和 高 度 复 杂 化 ,软件 质量 也 越 来 越 
重要 。 软 件 测试 目的 从 验证 软件 产品 可 以 工作 .尽量 发 现 产品 中 的 缺陷 ,逐渐 发 展 成 为 
软件 质量 保证 的 重要 手段 之 一 ,也 是 进行 软件 质量 评估 的 一 个 基础 。 

这 个 时 候 , 人 们 将 质量 的 概念 融入 软件 测试 。 软 件 测 的 试 定义 发 生 了 改变 ,测试 不 
单纯 是 一 个 发 现 缺 陷 的 过 程 ,而 且 将 测试 作为 软件 质量 保证 (SQA) 的 主要 职能 之 一 , 包 
含 软件 质量 评价 的 内 容 , 软 件 开发 人 员 和 测试 人 员 开 始 坐 在 一 起 探讨 软件 工程 和 测试 
问题 。 

IEEE Std 610. 12 一 1990 中 软件 测试 的 定义 如 下 。 

(1) 在 规定 条 件 下 运行 系统 或 组 件 的 过 程 。 观 察 和 记录 结果 ,并 对 系统 或 组 件 的 某 
些 方面 给 出 评价 。 

(2) 分 析 软 件 项 目的 过 程 。 检 测 现 有 状况 和 所 需 状况 之 间 的 不 同 , 并 评估 软件 项 目 
的 特性 。 
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1.2.4 测试 定义 总 结 


软件 开发 过 程 的 不 同 阶段 ,需要 考虑 不 同 的 测试 目的 。ISTQB 定义 的 主要 测试 目的 
有 4 个 , 即 发 现 缺陷 ,增加 对 质量 的 信心 ,为 决策 提供 信息 和 预防 缺陷 。 例 如 ,在 开发 周 
期 早期 阶段 (需求 分 析 阶 段 ,系统 设计 阶段 等 ), 通 过 人 工 的 检查 方式 (评审 ) 检 查 各 种 文 
档 的 缺陷 ,其 主要 目的 是 避免 将 早期 阶段 各 种 文档 内 的 缺陷 带 入 到 开发 阶段 ,从 而 造成 
更 大 的 缺陷 放大 。 而 开发 过 程 中 的 组 件 测试 、 集 成 测试 和 系统 测试 阶段 的 主要 测试 目的 
包括 验证 需求 和 尽 可 能 多 地 发 现 缺 陷 和 失效 ; 在 测试 过 程 中 不 断 为 利益 相关 者 提供 有 关 
风险 的 信息 ,例如 在 软件 系统 中 发 现 了 严重 错误 ,或 经 过 严格 测试 ,没有 发 现 严重 错误 等 
信息 。 在 验收 测试 阶段 ,测试 的 主要 目的 是 对 软件 的 质量 进行 评估 ,从 而 为 利益 相关 者 
提供 信息 和 信心 : 在 给 定时 间 内 发 布 的 系统 版 本 所 存在 的 风险 ,更 多 的 是 为 了 证 明 软 件 
系统 是 可 以 正常 工作 的 ,也 包含 了 软件 质量 保证 的 目的 。 

上 面 给 出 了 三 种 典型 的 软件 测试 定义 ,它们 之 间 并 不 是 完全 独立 和 对 立 的 。 在 实际 
的 测试 过 程 中 ,需要 根据 组 织 的 质量 方针 项目 特 点 、 测 试 阶段 和 使 用 的 测试 技术 等 方面 
的 具体 情况 ,来 确定 合适 的 软件 测试 目的 ,从 而 可 以 更 好 地 制订 软件 测试 策略 。 


1. 广义 的 软件 测试 


在 一 般 人 的 理解 中 ,软件 测试 活动 通常 指 的 是 运行 软件 进行 的 测试 , 即 狭义 的 测试 。 
测试 的 对 象 除了 程序 代码 之 外 ,还 应 该 包括 软件 开发 各 个 阶段 的 工作 产品 ,例如 需求 文 
档 、 设 计 文 档 、 用 户 手 册 等 。 因 此 ,传统 的 软件 测试 定义 (主要 关注 软件 运行 过 程 中 对 软 
件 对 象 进行 的 检查 和 发 现 不 一 致 的 行为 ) 是 一 个 狭义 的 概念 。 实 际 上 这 只 是 正式 测试 过 
程 的 一 部 分 。 

随 着 人 们 对 软件 工程 的 重视 以 及 软件 规模 的 日 益 扩大 ,软件 分 析 、 设 计 的 作用 越 来 
越 突 出 。 经 验 表明 ,一半 以 上 的 软件 错误 是 在 程序 代码 生成 之 前 引入 的 。 若 把 软件 分 析 
和 设计 中 的 问题 遗留 到 后 期 ,可 能 造成 设计 、 编 程 的 部 分 甚至 全 部 返工 ,从 而 导致 软件 开 
发 成 本 增加 、 开 发 周期 延长 等 后 果 。 同 时 ,需求 和 设计 阶段 所 产生 的 缺陷 雪崩 现象 (放大 
效应 ) ,会 严重 影响 软件 质量 和 大 大 提高 修改 缺陷 的 成 本 。 因 此 ,为 了 更 早 地 发 现 并 解决 
问题 ,降低 修改 缺陷 的 代价 ,有 必要 将 测试 往 前 延伸 到 需求 分 析 和 设计 阶段 中 去 ,使 软件 
测试 贯穿 于 整个 软件 开发 生命 周期 ,提倡 软件 全 生命 周期 测试 的 理念 。 即 软件 测试 是 对 
软件 开发 过 程 中 的 所 有 工作 产品 (包括 程序 以 及 相关 文档 进行 的 测试 ,而 不 仅仅 是 通过 
运行 程序 来 进行 的 动态 测试 。 

正式 的 测试 过 程 包含 了 测试 执行 之 前 和 之 后 的 所 有 的 阶段 活动 ,包括 测试 计划 和 控 
制 、 测 试 分 析 和 设计 、 测 试 实现 和 执行 评估 出 口 准则 和 报告 测试 结束 活动 。 根 据 是 否 
运行 软件 ,测试 活动 可 以 分 成 以 下 两 类 。 

(1) 动态 测试 : 需要 运行 被 测 对 象 ,并 在 运行 过 程 中 对 软件 进行 测试 。 
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(2) 静态 测试 : 不 需要 运行 被 测 对 象 ,其 测试 对 象 是 开发 过 程 中 生成 的 各 种 工作 产 
品 , 例 如 需求 文档 .设计 文档 \ 代 码 等 。 静 态 分 析 主 要 由 评审 和 静态 分 析 组 成 。 

广义 的 测试 ,可 以 引入 两 个 概念 来 覆盖 测试 的 范畴 : 验证 (Verification) 和 确认 
(Validation) 。 

(1) 验证 : 通过 检查 和 提供 客观 证 据 来 证 实 指定 的 需求 是 否 满足 。 换 句 话 说 ,验证 
要 回答 的 问题 是 : 是 否 在 正确 构建 产品 。 它 所 关注 的 是 构建 产品 的 过 程 ,按照 这 个 过 程 
是 否 能 开发 出 高 质量 的 软件 ,验证 只 针对 开发 过 程 的 单个 阶段 。 验 证 需要 确保 特定 开发 
阶段 的 输出 已 经 正确 而 完整 并 达到 相应 要 求 。 这 里 的 输出 通常 是 相关 的 文档 ,通常 ,一 
个 阶段 的 输出 又 是 下 一 个 阶段 的 输入 。 

(2) 确认 : 通过 检查 和 提供 客观 证 据 来 证 实 软件 产品 的 特定 目的 的 功能 或 应 用 是 否 
已 经 实现 。 换 句 话说 ,确认 要 回答 的 问题 是 是 否 构建 了 正确 的 产品 。 它 所 关注 的 是 已 经 
构建 的 软件 产品 ,对 于 每 个 测试 级 别 ,都 要 检查 开发 活动 输出 的 产品 是 否 满足 具体 的 需 
求 ,或 者 这 些 特定 级 别 相 关 的 需求 。 这 种 根据 原始 需求 检查 开发 结果 (产品 ) 的 过 程 称 为 
确认 。 在 确认 过 程 中 ,由 测试 人 员 来 判断 一 个 产品 (或 者 是 产品 的 一 部 分 ) 是 否 完成 它 的 
任务 , 据 此 判断 这 个 产品 是 否 满足 它 预 期 的 使 用 要 求 。 


2. 软件 测试 和 调试 


软件 开发 过 程 中 ,经 常会 提 到 测试 和 调试 两 个 不 同 的 概念 。 动 态 测试 可 以 发 现 由 于 
软件 存在 的 缺陷 而 引起 的 失效 。 而 调试 是 一 种 开发 活动 ,用 来 识别 引起 失效 的 原因 、 修 
改 代码 以 及 验证 是 否 正确 地 修改 了 软件 的 缺陷 (开发 人 员 在 修改 缺陷 之 后 ,需要 验证 软 
件 缺 陷 是 否 真 的 已 经 修改 ,这 也 是 开发 人 员 的 职责 之 一 )。 随 后 由 测试 人 员 进 行 的 确认 
测试 (再 测试 ) 是 为 了 确认 开发 人 员 是 否 已 经 正确 修改 了 缺陷 。 通 常 来 说 ,测试 人 员 进 行 
测试 活动 ,开发 人 员 进 行 调试 活动 (当然 ,开发 人 员 也 会 进行 一 些 测试 活动 ,例如 ,组 件 测 
试 通常 由 开发 人 员 来 进行 ); 除 此 之 外 ,调试 和 测试 的 不 同 还 表现 在 以 下 几 个 方面 。 

(1) 测试 和 调试 在 目标 和 方法 上 有 所 不 同 。 例 如 ,测试 的 目的 之 一 是 发 现 软件 中 的 
缺陷 ,而 调试 的 主要 目的 通常 是 为 了 定位 和 修改 软件 中 的 缺陷 。 

(2) 测试 是 从 已 知 的 条 件 开 始 ,使 用 预先 定义 的 过 程 ,通常 有 期 望 的 结果 ; 调试 是 从 
未 知 的 条 件 开始 , 结 果 也 很 难 预测 。 

(3) 测试 可 以 计划 ,可 以 预先 制定 测试 用 例 和 过 程 ,工作 进度 可 以 度量 ; 但 是 计划 调 
试 的 过 程 或 持续 时 间 相 对 比较 困难 。 

(4) 测试 的 对 象 包 括 软 件 开发 过 程 中 产生 的 各 种 文档 数据 以 及 代码 ,而 调试 的 对 象 
一 般 来 说 是 代码 。 

综 上 所 述 ,不 难得 出 结论 : 测试 不 等 同 于 调试 。 测 试 可 以 发 现 由 于 软件 存在 的 缺陷 
引起 的 失效 ; 而 调试 是 一 种 开发 活动 ,用 来 识别 引起 失效 的 原因 (缺陷 ) 和 采取 解决 方案 
来 修正 缺陷 。 二 者 都 是 软件 开发 过 程 中 必 不 可 少 的 活动 。 
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(5 软件 测试 的 基本 原则 


软件 测试 经 过 几 十 年 的 发 展 ,测试 界 提出 了 很 多 测试 原则 ,为 测试 人 员 提 供 了 测 
试 指南 。 软 件 测试 原则 非常 重要 ,测试 技术 和 方法 的 应 用 应 该 在 测试 原则 指导 下 
1. 穷尽 测试 是 不 可 能 的 


考虑 到 所 有 可 能 的 输入 值 和 它们 的 组 合 , 以 及 结合 所 有 不 同 的 测试 前 置 条 件 ,测试 
用 例 数 将 是 一 个 天 文 数字 。 对 这 样 的 天 文 数字 进行 穷尽 测试 几乎 是 不 可 能 的 。 在 实际 
测试 过 程 中 ,软件 不 可 能 执行 天 文 数 字 的 测试 用 例 。 因 此 ,测试 人 员 的 一 个 重要 职责 是 
高 效 地 设计 和 选择 测试 用 例 , 在 有 效 的 时 间 和 资源 情况 下 实现 测试 目标 。 

由 于 穷尽 测试 不 可 能 ,因此 无 法 发 现 被 测 对 象 的 所 有 缺陷 , 即 测试 后 软件 系统 中 还 
会 存在 缺陷。 被 测 对 象 存在 缺陷 ,就 可 能 会 给 用 户 /客户 带 来 各 种 损失 的 风险 。 测 试 过 
程 中 需要 分 析 被 测 对 象 的 风险 ,并 根据 风险 的 级 别 (风险 的 可 能 性 和 造成 损失 的 严重 程 
度 ) 指 导 测 试 活动 , 即 采用 基于 风险 的 测试 技术 。 例 如 ,根据 风险 的 级 别 设 定 测试 用 例 的 
优先 级 ,根据 优先 级 来 执行 测试 等 。 根 据 风险 的 信息 不 仅 可 以 设置 测试 用 例 的 优先 级 ， 
还 可 以 用 来 控制 测试 工作 量 合理 分 配 测试 成 本 和 资源 等 ,在 收益 和 风险 之 间 求 得 平衡 。 
通常 在 测试 计划 阶段 就 要 考虑 测试 结束 条 件 , 即 测试 的 出 口 准则 。 在 执行 测试 过 程 中 ， 
当 满 足 测试 出 口 准则 时 测试 就 应 当 终止 。 


2. 测试 只 能 显示 缺陷 的 存在 


当 软 件 测 试 发 现 缺陷 时 ,可 以 肯定 地 说 软件 系统 内 存在 缺陷 。 但 通过 测试 没有 发 现 
缺陷 时 ,并 不 能 说 软件 系统 内 没有 缺陷 ,因为 测试 只 是 做 了 抽样 检查 ,无 法 穷尽 测试 。 测 
试 可 以 减少 软件 中 存在 缺陷 的 可 能 性 ,但 即使 测试 没有 发 现任 何 缺陷 ,也 不 能 证 明 软 件 
或 系统 是 完全 正确 的 ,或 者 说 是 不 存在 缺陷 的 。 


3. 测试 应 尽早 介入 


根据 经 验 , 在 软件 开发 过 程 的 需求 阶段 引入 的 缺陷 占 软 件 过 程 中 出 现 的 所 有 缺陷 
(包括 最 终 的 缺陷 ) 数 量 的 56% .9 此 外 ,缺陷 存在 雪崩 效应 。 例 如 需求 阶段 的 一 个 缺陷 
可 能 会 导致 N 个 设计 缺陷 ,因此 , 越 是 在 软件 开发 过 程 的 后 期 发 现 缺 陷 ,为 修复 缺陷 所 付 
出 的 代价 就 会 越 大 。 因 此 ,软件 测试 人 员 要 尽早 地 上 且 不 断 地 进行 软件 测试 ,以 提高 软件 
质量 ,降低 软件 开发 成 本 。 


四 ”Dick Bender, Writing testable requirement, 1993. 
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4. 缺陷 的 集群 性 


帕 累 托 (Pareto) 原 则 表明 ,软件 中 80% 的 错误 集中 在 20% 的 区 域内 ,实际 经 验 也 证 
明了 这 一 点 。 通 常情 况 下 ,大 多 数 的 缺陷 只 是 存在 于 测试 对 象 的 部 分 模块 中 ,缺陷 并 不 
是 平均 而 是 集群 分 布 的。 测试 人 员 如 果 在 一 个 模块 发 现 了 很 多 缺陷 ,那么 通常 在 这 个 模 
块 中 还 会 有 更 多 的 缺陷 。 因 此 ,测试 过 程 中 要 充分 注意 缺陷 的 集群 现象 ,对 发 现 缺 陷 较 
多 的 程序 段 或 者 软件 模块 ,应 进行 更 深入 的 测试 。 


5. 杀 虫 剂 效 应 


杀 虫 剂 用 得 多 了 ,害虫 就 有 免疫 力 ,此 时 杀 虫 剂 就 发 挥 不 了 效力 。 测 试 过 程 中 ,重复 
执行 同样 的 测试 用 例 ,其 发 现 缺陷 的 能 力 就 会 越 来 越 差 。 测 试 中 存在 杀 虫 剂 效 应 的 主要 
原因 是 : 在 以 发 现 缺陷 为 主要 目的 的 测试 中 ,反复 使 用 同一 个 测试 用 例 和 测试 数据 ,很 难 
再 发 现 新 的 缺陷 (能 发 现 的 缺陷 已 经 在 前 面 的 测试 过 程 中 发 现 了 ) 。 

为 克服 杀 虫 剂 效应 ,测试 用 例 需要 经 常 进行 评审 和 修改 ,不 断 增加 不 同 的 测试 用 例 
或 用 不 同 的 测试 数据 来 测试 软件 或 系统 的 不 同 部 分 ,保证 测试 用 例 或 测试 数据 是 最 新 
的 , 即 包含 着 最 后 一 次 程序 代码 或 说 明文 档 的 更 新 信息 。 这 样 软件 中 未 被 测试 过 的 部 分 
或 者 先前 没有 被 使 用 过 的 输入 组 合 就 会 重新 执行 ,从 而 发 现 更 多 的 缺陷 。 同 时 ,作为 专 
业 的 测试 人 员 , 要 具有 探索 性 思维 和 逆向 思维 ,而 不 仅仅 是 做 实际 结果 与 期 望 结 果 的 
比较 。 


6. 测试 活动 依赖 于 测试 上 下 文 


测试 活动 依赖 于 测试 上 下 文 。 对 于 不 同 的 软件 系统 ,对 测试 策略 、 测 试 技术 、 测 试 工 
具 、 测 试 阶段 以 及 测试 出 口 准则 等 的 选择 ,都 是 不 一 样 的。 同时 ,测试 活动 必须 与 被 测试 
对 象 的 运行 环境 和 使 用 中 的 风险 相关 联 。 因 此 ,没有 两 个 系统 可 以 以 完全 相同 的 方式 进 
行 测试 。 例 如 ,对 关注 安全 的 电子 商务 系统 进行 测试 ,与 一 般 的 商业 软件 测试 ,它们 关注 
的 重点 是 不 一 样 的 。 对 于 前 者 , 它 更 多 关注 的 是 安全 性 测试 和 性 能 测试 。 


7. 没有 失效 不 代表 系统 是 可 用 的 


系统 的 质量 特性 不 仅仅 是 功能 性 要 求 , 还 包括 很 多 非 功能 性 的 要 求 , 例 如 稳定 性 、 可 
用 性 ,兼容 性 等 。 假 如 系统 无 法 使 用 ,或 者 系统 不 能 满足 客户 的 需求 和 期 望 ,那么 这 个 系 
统 的 研发 是 失败 的 。 同 时 在 系统 中 发 现 和 修改 缺陷 也 是 没有 任何 意义 的 。 

用 户 的 早期 介入 和 提供 原型 系统 ,是 开发 过 程 中 避免 类 似 问题 的 预防 性 措施 。 从 开 
发 角度 看 起 来 完美 的 软件 产品 ,如 果 不 是 客户 真正 想 要 的 产品 ,这 样 的 软件 产品 开发 也 
是 失败 的 。 
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(4 测试 的 基本 过 程 


软件 测试 应 该 是 贯穿 于 整个 软件 开发 生命 周期 的 一 个 完整 的 过 程 , 测 试 的 尽早 介入 
是 软件 测试 的 一 个 基本 原则 ; 将 软件 测试 仅仅 看 作 是 运行 软件 工作 产品 进行 相关 的 检查 
活动 或 者 软件 开发 的 一 个 阶段 ,不 是 系统 化 测试 的 理念 。 为 了 有 效 地 实现 软件 测试 各 个 
层面 的 测试 目标 , 则 需要 和 软件 开发 过 程 一 样 ,定义 一 个 正式 而 完整 的 软件 测试 过 程 , 即 
涉及 各 个 软件 测试 活动 ,技术 文档 等 内 容 的 过 程 ,来 指导 和 管理 软件 测试 活动 ,以 提高 
测试 效率 和 测试 质量 ,同时 改进 软件 开发 过 程 和 测试 过 程 。 

作为 广义 的 软件 测试 ,ISTQB 定义 了 完整 的 软件 测试 过 程 , 将 测试 相关 的 所 有 活动 
都 纳入 其 中 ,如 图 1-6 所 示 。 


— 测试 计划 和 测试 控制 


1 
2 测试 分 析 和 设计 


测试 实现 和 执行 
| 评估 出 口 准则 和 


测试 报告 


测试 结束 活动 


图 1-6 ISTQB 定义 的 软件 测试 过 程 


图 1-6 描述 的 软件 测试 过 程 ,给 人 的 感觉 好 像 各 个 阶段 是 顺序 进行 的 。 但 实际 上 有 
些 测试 阶段 在 时 间 上 是 可 以 重合 的 ,甚至 是 并 行进 行 的 ,例如 测试 分 析 和 设计 、 测 试 实现 
和 执行 阶段 在 时 间 上 可 能 是 重 倒 的 ,而 测试 控制 活动 会 贯穿 于 整个 测试 过 程 。 


1.4.1 测试 计划 和 控制 阶段 


通常 在 项 目 开 始 的 时 候 就 需要 进行 测试 计划 活动 。 制 订 测试 计划 的 目的 是 通过 确 
定 测试 任务 .定义 测试 对 象 和 定义 详细 的 测试 活动 来 达到 组 织 的 目标 和 使 命 。 测 试 计划 
需要 文档 化 ,针对 不 同 的 测试 级 别 (如 系统 测试 .验收 测试 ) 需 要 不 同 的 测试 计划 。 
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制订 测试 计划 会 受到 各 种 因素 的 影响 ,例如 组 织 的 质量 方针 和 测试 方针 、 项 目的 测 
试 范围 .项 目的 测试 目的 测试 中 存在 的 风险 测试 的 约束 条 件 和 资源 的 可 用 性 等 。 随 着 
项 目的 不 断 推进 和 深入 ,将 有 更 多 的 信息 和 具体 细节 包含 在 测试 计划 中 ,从 而 用 来 修正 
和 更 新 测试 计划 内 容 。 因 此 ,测试 计划 的 制订 是 一 个 持续 的 过 程 ,需要 在 整个 测试 过 程 
中 进行 不 断 的 调整 和 更 新 。 例 如 从 测试 活动 中 得 到 的 反馈 信息 可 以 识别 测试 中 的 新 风 
险 ,从 而 需要 对 测试 计划 中 的 风险 部 分 内 容 做 相应 的 修改 。 

制订 测试 计划 时 需要 确定 测试 方法 ,例如 基于 风险 的 测试 方法 。 此 时 ,需要 在 测试 
过 程 中 识别 风险 和 评估 风险 ,并 根据 风险 级 别 采 取 相 应 的 措施 ,以 帮助 测试 计划 的 有 效 
实施 。 

测试 依据 (Test Basis) ,测试 条 件 (Test Condition) ,测试 用 例 (Test Case) 和 测试 规 
程 (Test Procedure) 之 间 存 在 复杂 的 关系 ,需要 通过 测试 计划 来 理 顺 关系 ,并 且 能 够 控制 
它们 之 间 的 相互 关系 ,使 得 测试 得 以 顺利 进行 。 

定义 测试 出 口 准则 ,也 是 测试 计划 中 的 一 个 重要 内 容 ,其 目的 是 确定 什么 时 候 可 以 
结束 测试 。 例 如 判断 某 个 测试 级 别 是 否 可 以 结束 ,需要 判断 当前 的 测试 是 否 达 到 了 规定 
的 目标 。 测 试 出 口 准则 可 以 基于 以 下 一 些 度量 进行 判断 。 

(1) 测试 完整 性 度量 ,例如 代码 .功能 或 风险 的 测试 覆盖 率 。 

(2) 对 软件 缺陷 密度 .缺陷 趋势 或 系统 可 靠 性 的 评估 ,来 判断 测试 的 出 口 准则 。 

(3) 评估 继续 测试 的 成 本 , 即 继续 测试 的 收益 和 结束 测试 可 能 存在 风险 之 间 的 平衡 

(4) 评估 可 能 遗留 的 风险 ,例如 评估 没有 被 修改 的 缺陷 、 在 某 些 区 域 测试 蓝 盖 率 较 低 
等 对 项 目 或 者 产品 可 能 产生 的 风险 。 

(5) 评估 项 目 产品 的 交付 时 间 ,例如 客户 要 求 的 软件 产品 交付 时 间 ,或 者 测试 计划 规 
定 的 截止 时 间 等 。 

测试 控制 活动 应 该 贯穿 于 整个 测试 过 程 , 通 过 测试 状态 和 其 他 的 测试 进度 信息 ,和 
制订 的 测试 计划 进行 比较 ,发 现 其 中 的 偏差 和 问题 ,采取 相应 的 手段 来 对 测试 活动 进行 
控制 ,从 而 使 测试 活动 能 够 按照 测试 计划 进行 。 另 外 ,测试 监控 得 到 的 反馈 数据 和 信息 ， 
又 可 以 帮助 更 新 原先 制订 的 测试 计划 。 

测试 控制 必须 对 测试 提供 的 一 些 信 息 做 出 回应 ,同时 做 出 相应 计划 的 变更 。 例 如 ， 
动态 测试 在 某 个 原来 认为 问题 不 大 的 领域 发 现 许多 缺陷 ,或 者 由 于 测试 开始 时 间 延 迟 导 
致 测试 执行 时 间 太 短 ,在 这 些 情况 下 都 需要 对 测试 风险 分 析 和 测试 计划 进行 相应 的 变 
更 。 变 更 也 可 能 会 导致 对 后 续 的 测试 工作 重新 进行 优先 级 排 定 和 分 配 。 

总 的 来 说 ,测试 计划 和 控制 阶段 的 主要 测试 活动 如 下 。 

(1) 执行 测试 方针 和 测试 指南 : 熟悉 和 理解 组 织 的 测试 方针 和 测试 指南 ,并 且 将 组 
织 的 这 些 方针 、 指 南 和 测试 计划 的 制订 结合 起 来 。 

(2) 确定 测试 范围 和 风险 : 确定 测试 的 主要 范围 ,确定 项 目的 风险 ,并 且 根 据 风险 级 
别 ,确定 测试 的 重点 和 优先 级 。 
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(3) 确定 测试 目的 : 不 同 组 织 、 不 同 项 目 以 及 不 同 测试 级 别 ,其 测试 目的 是 不 一 样 
的 。 测 试 目 的 可 以 是 证 明 软件 系统 可 以 正常 工作 ,也 可 以 是 尽 可 能 多 地 发 现 缺陷 ,也 可 
能 是 通过 收集 测试 信息 和 数据 ,来 改进 软件 开发 和 测试 过 程 ,或 者 上 面 这 些 测试 目的 兼 
而 有 之 。 因 此 ,需要 在 测试 计划 阶段 ,明确 测试 目的 ,从 而 采用 不 同 的 测试 策略 ,分 配 相 
应 的 测试 资源 。 

(4) 确定 测试 方法 : 针对 不 同 的 测试 级 别 ,需要 确定 不 同 的 测试 技术 ,例如 基于 结构 
的 白 盒 测试 技术 或 基于 说 明 的 黑 盒 测试 技术 。 静 态 测试 (评审 和 静态 分 析 ) 在 测试 过 程 
的 前 期 使 用 得 也 比较 多 。 

(5) 确定 测试 资源 : 测试 计划 中 明确 测试 所 需 的 资源 ,对 测试 是 否 成 功 非常 关键 。 
测试 资源 包括 人 力 资 源 、 测 试 使 用 的 PC 和 相关 的 工具 软件 系统 、 测 试 所 需 的 网 络 设备 、 
测试 仪表 以 及 测试 环境 的 分 配 等 。 

(6) 计划 测试 的 进度 : 根据 整个 软件 项 目的 进度 、 资 源 和 测试 范围 ,安排 整个 测试 活 
动 的 进度 ,以 及 进行 人 力 资源 的 安排 。 

(7) 确定 测试 入口 /出 口 准则 : 在 测试 计划 中 需要 确定 测试 入 口 准则 ,测试 出 口 准 则 
和 测试 挂 起 准则 、 测 试 恢 复 准 则 ,它们 分 别 说 明了 在 什么 情况 下 满足 入 口 准 则 ,可 以 开始 
执行 测试 ; 什么 情况 下 满足 出 口 准则 ,可 以 正常 结束 测试 执行 ; 什么 情况 下 满足 挂 起 准 
则 ,需要 非 正常 地 中 止 测试 ; 以 及 什么 情况 下 满足 恢复 准则 ,可 以 重新 开始 测试 。 

(8) 监控 和 记录 测试 进度 ,测试 柳 盖 率 : 监控 测试 过 程 的 信息 ,包括 测试 进度 和 实际 
计划 进度 的 比较 ,测试 履 盖 率 和 测试 出 口 准则 ,测试 挂 起 准则 的 满足 程度 等 ,这 些 信息 也 
作为 测试 控制 的 主要 输入 条 件 和 信息 。 

(9) 度量 和 分 析 测 试 结果 : 根据 测试 过 程 中 得 到 的 数据 ,例如 测试 发 现 的 缺陷 数目 、 
测试 用 例 执 行 的 数目 测试 用例 失败 的 数目 等 ,对 测试 过 程 和 测试 质量 ,产品 质量 进行 分 
析 ,并 根据 分 析 结 果 采 取 合 适 的 措施 和 应 对 计划 ,例如 测试 重点 和 优先 级 的 调整 。 

(10) 修正 测试 计划 : 根据 前 面 测试 度量 和 分 析 的 结果 ,以 及 测试 监控 过 程 中 得 到 的 
信息 ,采取 合适 的 措施 和 应 对 计划 ,变更 计划 或 者 变更 资源 分 配 ,使 得 测试 活动 按照 期 望 
进行 下 去 。 

(11) 做 出 决定 : 根据 测试 度量 和 分 析 的 结果 ,做 出 相应 的 决定 ,包括 测试 重启 、 测 试 
结束 、 测 试 挂 起 、 测 试 变更 ,测试 应 对 计划 实施 等 。 


1.4.2 测试 分 析 和 设计 阶段 


在 测试 分 析 和 设计 阶段 ,测试 人 员 将 利用 在 测试 计划 阶段 识别 的 测试 对 象 、 测 试 范 
围 和 测试 目的 ,识别 具体 的 测试 需求 ,并 且 根 据 测试 条 件 设 计 相 应 的 测试 用 例 ,覆盖 这 些 
测试 需求 。 

在 测试 分 析 和 设计 阶段 ,通常 会 同时 使 用 多 种 测试 技术 ,例如 基于 风险 的 测试 技术 、 
基于 经 验 的 测试 技术 等 。 基 于 不 同 的 测试 技术 ,分 析 测 试 对 象 和 测试 依据 ,从 而 获得 测 
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试 需求 。 不 同 测试 级 别 , 其 参考 的 测试 依据 是 不 一 样 的 ,例如 需求 说 明 、 用 例 和 业务 流程 
通常 是 系统 测试 的 依据 ; 而 低级 别 的 设计 说 明 通常 作为 组 件 测试 的 测试 依据 。 

在 测试 条 件 识别 和 测试 用 例 设计 过 程 中 ,会 输出 一 系列 的 工作 产品 ,例如 测试 设计 
说 明 ,测试 用 例 说 明 。 不 同 的 组 织 或 者 项 目 , 实 际 输出 的 测试 工作 产品 也 会 有 所 不 同 ,其 
主要 会 受 以 下 因素 的 影响 。 

(1) 过 程 成 熟 度 : 组 织 的 开发 过 程 定义 了 测试 过 程 中 需要 提交 的 工作 产品 。 不 同 的 
过 程 成 熟 度 对 工作 产品 的 输出 有 不 同 的 要 求 。 对 于 具有 高 成 熟 度 的 组 织 ,一般 都 有 定义 
好 的 测试 工作 产品 的 模板 ,例如 测试 设计 说 明 ,测试 用 例 说 明 等 。 

(2) 采用 的 开发 模型 : 使 用 的 软件 开发 过 程 模型 会 影响 测试 工作 产品 的 输出 ,例如 
采用 敏捷 开发 方法 ,会 尽量 减少 文档 ,取而代之 的 是 紧密 频繁 的 小 组 之 间 的 讨论 。 

根据 测试 计划 中 确定 的 测试 范围 ,测试 分 析 和 设计 可 以 确定 测试 对 象 的 质量 特性 。 
ISO 9126 标准 提供 了 一 些 关 于 质量 特性 的 参考 。 
测试 人 员 在 早期 参与 评审 和 静态 分 析 , 可 以 提高 测试 分 析 和 设计 的 效率 。 例 如 评审 
需求 说 明 就 是 测试 人 员 进 行 测试 分 析 的 有 效 选择 。 测 试 过 程 中 输出 的 工作 产品 ,例如 测 
试 设计 说 明 , 也 应 该 经 过 静态 测试 的 检查 ,以 提高 它们 的 质量 。 
测试 分 析 和 设计 阶段 的 主要 输入 有 : 
(1) 测试 计划 ; 
(2) 测试 依据 ,例如 系统 需求 说 明 ， 
(3) 行业 行规 .法律 法 规 、 领 域 知识 。 
测试 分 析 和 设计 阶段 的 主要 活动 有 : 
) 评审 测试 依据 (例如 需求 说 明 、 系 统 架 构 ,设计 和 接口 说 明 等 )。 
(2) 评估 测试 依据 和 测试 对 象 的 可 测 性 。 
(3) 通过 对 测试 依据 和 测试 对 象 行为 的 分 析 , 识 别 测试 需求 并 确定 其 优先 级 。 
(4) 设计 测试 用 例 并 确定 优先 级 。 
(5) 确定 测试 需求 和 测试 用 例 所 需 的 测试 数据 。 
(6) 规划 测试 环境 的 搭建 和 确定 测试 需要 的 基础 设施 和 工具 。 


1.4.3 测试 实现 和 执行 阶段 


测试 实现 和 执行 阶段 的 主要 活动 包括 通过 特定 的 顺序 组 织 测试 用 例 来 完成 测试 规 
程 和 脚本 的 设计 ,并 且 包 括 测试 执行 必需 的 任何 其 他 的 信息 ,以 及 测试 环境 的 搭建 和 运 
行 测试 。 

根据 测试 计划 ,测试 设计 说 明 ,测试 用 例 说 明 , 结 合 各 个 测试 用 例 之 间 可 能 存在 的 依 
赖 关 系 , 设 置 测试 执行 的 顺序 ,例如 根据 业务 流程 设置 执行 顺序 ; 根据 测试 用 例 的 优先 级 
设置 执行 顺序 。 

测试 用 例 执行 时 需要 选择 合适 的 测试 数据 。 在 有 些 测试 中 ,测试 数据 甚至 是 非常 庞 
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大 的 。 因 此 ,在 测试 实现 阶段 ,测试 人 员 可 以 将 输入 数据 转换 成 相应 的 数据 库 。 同 时 , 测 
试 人 员 也 可 能 需要 编写 脚本 生成 测试 数据 ,在 测试 执行 时 作为 软件 系统 的 输入 。 

假如 采用 自动 化 测试 ,测试 实现 还 包括 了 自动 化 测试 套件 和 测试 脚本 的 创建 和 开 
发 。 测 试 人 员 应 该 考虑 一 些 具 体 的 可 能 会 影响 测试 顺序 的 制约 因素 ,同时 测试 环境 和 测 
试 数据 之 间 的 相互 依赖 关系 必须 在 测试 实现 阶段 予以 考虑 。 

测试 实现 阶段 ,测试 人 员 需 要 搭建 和 维护 测试 环境 ,保证 测试 执行 环境 和 测试 管理 
环境 (配置 管理 、 缺 陷 管理 等 ) 的 可 用 。 测 试 环境 应 该 在 测试 执行 之 前 完成 搭建 和 相关 的 
验证 工作 。 对 于 高 级 别 的 测试 ,例如 系统 测试 ,测试 环境 应 该 尽量 和 用 户 的 使 用 环境 接 
近 , 以 模拟 用 户 场 景 。 另 外 ,测试 人 员 在 测试 实现 和 执行 阶段 需要 考虑 后 续 测 试 活动 的 
数据 收集 。 

当 测 试 对 象 满足 测试 执行 的 入 口 准 则 时 ,测试 执行 就 可 以 开始 了 。 测 试 执行 应 该 按 
照 确定 的 测试 顺序 进行 。 测 试 执行 活动 的 一 个 核心 内 容 是 对 测试 实际 结果 和 期 望 结 果 
进行 比较 。 测 试 人 员 应 该 注意 期 望 结果 和 实际 结果 的 比较 ,否则 可 能 导致 缺陷 和 失效 的 
遗漏 。 若 测试 实际 结果 和 期 望 结 果 不 符 , 首 先 需要 仔细 检查 测试 用 例 , 以 保证 测试 用 例 
描述 的 正确 性 。 测 试用 例 描述 也 可 能 有 错误 ,可 能 的 原因 包括 测试 数据 的 错误 、 测 试 文 
档 描述 的 错误 ,或 者 执行 方法 的 错误 。 如 果 测 试用 例 的 描述 存在 问题 , 则 首先 需要 对 它 
进行 修改 ,然后 重新 执行 测试 用 例 。 如 果 确 认 是 测试 对 象 的 问题 ,就 需要 提交 缺陷 报告 。 

在 测试 执行 阶段 ,测试 执行 过 程 和 结果 必须 妥善 记录 , 即 测试 日 志 。 执 行 过 的 测试 
用 例 , 由 于 没有 记录 测试 结果 ,很 有 可 能 出 现 重复 执行 的 情况 ,从 而 导致 测试 效率 低下 和 
测试 进度 延期 。 由 于 测试 对 象 和 测试 环境 会 随 着 被 测试 版 本 的 变化 而 变化 ,所 以 测试 记 
录 应 该 基于 相应 的 测试 版 本 。 

测试 日 志 提供 了 按照 时 间 顺 序 的 测试 执行 相关 细节 。 测 试 结 果 的 记录 可 以 针对 整 
个 测试 过 程 ,也 可 以 针对 某 个 事件 。 任 何 影响 测试 执行 的 事件 都 需要 单独 记录 。 为 了 测 
量 测 试 获 盖 率 和 查找 测试 延期 的 原因 ,需要 测试 人 员 记 录 详 细 的 测试 信息 。 另 外 ,记录 
的 信息 也 可 以 用 来 帮助 测试 控制 ,测试 进度 报告 的 生成 ,测试 出 口 准则 评估 和 测试 过 程 
的 改进 等 。 

用 户 或 者 客户 也 可 能 参与 测试 执行 。 例 如 验收 测试 ,在 验收 测试 过 程 中 发 现 的 缺陷 
越 少 , 越 有 助 于 客户 对 软件 产品 建立 信心 。 

测试 实现 和 执行 阶段 的 主要 输入 有 : 

(1) 测试 计划 ; 

(2) 测试 需求 ; 

(3) 测试 设计 说 明 ; 

(4) 测试 用 例 说 明 。 

测试 实现 和 执行 的 主要 测试 活动 有 : 

(1) 创建 测试 数据 。 

(2) 编写 测试 规程 说 明 。 
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(3) 开发 测试 自动 化 脚本 。 

(4) 根据 测试 规程 说 明 创 建 测试 套件 。 

(5) 搭建 并 验证 测试 环境 。 

(6) 执行 测试 用 例 , 包 括 手 工 和 自动 化 执行 。 
(7) 记录 测试 执行 的 过 程 和 结果 (测试 日 志 ) 。 
(8) 测试 实际 结果 和 期 望 结 果 的 比较 。 

(9) 提交 缺陷 报告 。 

(10) 确认 测试 和 回归 测试 。 


1.4.4 评估 出 口 准则 和 报告 


评估 测试 出 口 准则 与 测试 过 程 监控 紧密 联系 ,测试 过 程 监控 度量 数据 是 评估 测试 出 
口 准则 的 基础 。 常 见 的 测试 过 程 监控 度量 数据 包括 以 下 几 种 : 

(1) 测试 需求 的 覆盖 率 、 测 试用 例 覆 盖 率 .通过 /失败 的 测试 用 例 执行 的 数目 。 

(2) 提交 的 缺陷 数目 ,根据 缺陷 的 严重 程度 和 优先 级 进行 的 分 类 。 

(3) 提交 的 缺陷 数目 ,接受 的 缺陷 和 被 拒绝 的 缺陷 的 比例 。 

(4) 测试 中 计划 的 成 本 支出 和 实际 的 成 本 支出 。 

(5) 测试 中 计划 的 花费 时 间 和 实际 的 花费 时 间 。 

(6) 测试 中 识别 的 风险 和 处 理 的 风险 数目 。 

(7) 由 于 事件 制约 因素 而 浪费 的 时 间 。 

(8) 总 的 测试 计划 时 间 和 有 效 利用 的 测试 时 间 。 

对 于 测试 报告 ,IEEE Std 829 一 1998 中 描述 了 测试 报告 的 构成 ,主要 包括 以 下 的 一 
些 条 目 。 

(1) 测试 报告 标识 符 : 为 该 测试 报告 规定 唯一 的 标识 符 。 

(2) 摘要 : 总 结对 测试 项 的 评价 。 标 识 已 测试 的 各 个 项 ,指出 其 版 本 /修订 级 别 ,并 
指出 执行 测试 活动 所 处 的 环境 。 对 于 每 个 测试 项 ,如 果 存在 测试 计划 ,测试 设计 说 明 、 测 
试 规程 说 明 ,测试 项 传递 报告 测试 日 志和 事件 报告 文档 , 则 应 提供 对 相关 信息 的 引用 。 

(3) 差异 : 报告 测试 项 与 其 设计 说 明之 间 的 任何 差异 ,并 指出 与 测试 计划 ,测试 设计 
或 测试 规程 说 明之 间 的 任何 差异 ,详细 说 明 每 种 差异 产生 的 原因 。 

(4) 测试 充分 性 评价 : 如 果 有 测试 计划 ,应 根据 测试 计划 中 规定 的 测试 出 口 准 则 对 
测试 过 程 做 出 评价 。 确 定 未 做 充分 测试 的 特征 或 特征 组 合 ,并 说 明理 由 。 

(5) 结果 汇总 : 汇总 测试 的 结果 。 标 识 已 解决 的 所 有 缺陷 ,并 总 结 其 解决 方案 。 指 
出 尚未 解决 的 所 有 缺陷 ,并 说 明 可 能 的 风险 。 

(6) 评价 : 对 每 个 测试 项 (包括 其 限制 ) 进 行 总 体 评价 ,该 评价 必须 以 测试 结果 和 测 
试 项 的 通过 准则 作为 依据 。 可 以 包含 对 风险 的 估计 。 

(7) 活动 总 结 : 总 结 主要 的 测试 活动 和 事件 。 总 结 资源 消耗 数据 ,例如 人 员 的 总 体 
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配备 水 平和 每 个 主要 测试 活动 所 花费 的 时 间 。 

(8) 批准 : 详细 说 明 必须 批准 该 测试 报告 的 所 有 人 员 的 姓名 和 职务 ,并 为 签名 和 日 
期 留 出 位 置 。 

IEEE Std 829 一 1998 中 的 测试 报告 内 容 , 可 以 指导 编写 测试 报告 , 当然 并 不 一 定 要 
包括 上 面 罗列 的 所 有 条 目 , 也 可 以 根据 组 织 的 自身 特点 增加 一 些 特殊 条 目 。 一 般 可 以 根 
据 组 织 自己 的 具体 文档 模板 和 项 目 特性 ,选择 测试 报告 的 组 成 内 容 。 任 何 一 个 测试 级 别 
的 测试 工作 全 部 完成 以 后 都 需要 输出 测试 报告 。 

评估 测试 出 口 准则 和 报告 阶段 的 主要 输入 有 : 

(1) 描述 当前 测试 状态 的 报告 ; 

(2) 描述 当前 缺陷 状态 的 报告 ; 

(3) 对 当前 的 风险 进行 分 析 的 报告 ; 

(4) 项 目测 试 周报 告 /月 报告 ; 

(5) 测试 计划 。 

评估 测试 出 口 准则 和 报告 阶段 的 主要 测试 活动 有 : 

(1) 将 测试 状态 和 测试 计划 中 的 出 口 准 则 进行 比较 。 

(2) 评估 是 否 需 要 更 多 的 测试 执行 ,以 及 是 否 为 了 满足 出 口 准则 而 需要 增加 新 的 测 
试用 例 , 或 者 考虑 是 否 需要 更 改 测试 出 口 准 则 。 

(3) 编写 和 提交 测试 报告 。 

测试 出 口 准 测 的 评估 ,是 检验 测试 对 象 是 否 达到 预先 定义 的 一 组 测试 目标 和 是 否 符 
合 出 口 准则 的 活动 。 测 试 出 口 准 测 的 评估 可 能 产生 以 下 结果 : 测试 结果 达到 结束 的 条 
件 , 即 满足 出 口 准则 ,测试 执行 活动 可 以 正常 终结 ; 可 能 发 现 了 新 的 产品 风险 而 执行 一 些 
附加 测试 用 例 ; 测试 出 口 准则 要 求 过 高 而 不 合理 ,需要 对 测试 出 口 准则 进行 修改 。 在 此 
评估 中 ,测试 人 员 必 须 决 定 是 否 完全 满足 测试 计划 中 的 测试 出 口 准则 。 例 如 测试 对 象 中 
有 80% 的 语句 被 执行 到 ,可 以 作为 测试 出 口 准则 之 一 。 

如 果 执 行 完 所 有 计划 的 测试 用 例 后 ,测试 出 口 准则 的 一 个 或 多 个 条 目 还 没有 满足 ， 
可 能 需要 选择 或 设计 新 的 测试 用 例 进 行进 一 步 的 测试 ,或 者 修改 测试 出 口 准则 。 如 果 需 
要 增加 测试 用 例 的 话 , 则 这 些 新 的 测试 用 例 应 该 对 满足 出 口 准则 是 有 利 的 。 和 否则 ,额外 
的 测试 用 例 只 会 增加 工作 量 而 不 会 对 评估 出 口 准 则 有 任何 改进 。 

为 了 满足 出 口 准则 ,有 时 需要 采用 不 同 的 测试 技术 。 例 如 为 了 测试 某 种 异常 情况 下 
的 响应 时 间 ,而 当前 的 测试 环境 无 法 模拟 该 异常 情况 ,从 而 导致 无 法 执行 和 测试 相应 的 
代码 。 这 时 候 应 该 考虑 采用 其 他 的 测试 方法 ,例如 评审 或 者 静态 分 析 。 

导致 测试 出 口 准则 无 法 满足 的 另外 一 种 可 能 是 被 测 对 象 本 身 的 问题 ,例如 测试 对 象 
中 包含 死 代码 (Dead Code) ,无 法 达到 100%% 的 语句 覆盖 率 。 测 试 出 口 准则 的 评估 过 程 
中 ,要 对 诸如 此 类 的 问题 考虑 周全 ,避免 因为 无 意义 的 测试 出 口 准 则 而 进行 的 无 效 的 测 
试 。 另 外 ,还 需要 检查 被 测 对 象 中 为 什么 存在 死 代 码 ,以 期 发 现 更 多 的 缺陷 。 

除了 测试 覆盖 率 ,测试 出 口 准则 还 可 以 考虑 其 他 因素 .例如 失效 率 ,或 者 缺陷 发 现 百 
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分 比 (Defect Detection Percentage, DDP)。 如 果 失 效率 下 降 到 给 定 的 阅 值 (例如 失效 率 
小 于 1 个 /天 ) ,就 表明 不 再 需要 更 多 的 测试 ,测试 工作 可 以 结束 。 根 据 失 效率 评估 测试 
出 口 准则 时 还 应 该 考虑 失效 的 严重 程度 ,对 失效 进行 分 类 并 区 别 对 待 。 

在 实际 项 目 中 ,测试 是 否 可 以 结束 还 经 常 与 时 间 和 成 本 因素 有 关 。 如 果 这 些 因素 导 
致 强制 停止 测试 活动 , 则 可 能 是 因为 在 项 目 计 划 中 没有 配置 足够 的 资源 ,或 者 低估 了 某 
项 测试 的 工作 量 。 

相对 于 测试 计划 中 要 求 的 测试 资源 ,实际 测试 可 能 会 消耗 更 多 资源 。 但 是 通过 测试 
可 以 发 现 软件 中 的 缺陷 ,修复 缺陷 之 后 在 一 定 程度 上 降低 了 软件 的 质量 风险 。 因 为 软件 
中 的 缺陷 在 实际 运行 时 导致 系统 失效 而 引起 的 成 本 往往 远 高 于 在 测试 时 发 现 并 修复 缺 
陷 的 成 本 。 

完成 测试 任务 之 后 ,需要 提交 报告 。 测 试 报告 指 的 是 对 软件 系统 或 组 件 进行 测试 产 
生 的 行为 及 结果 的 描述 文件 。 测 试 报告 以 文档 的 形式 ,描述 了 被 测 对 象 的 测试 情况 和 测 
试 结果 ,并 对 相关 的 结果 和 数据 进行 分 析 , 向 管理 层 提供 信息 和 建议 。 测 试 报告 是 测试 
活动 的 一 个 重要 输出 ,必须 得 到 管理 层 的 批准 ,才能 够 成 为 正式 的 测试 文档 。 

应 当 向 利益 相关 者 提交 测试 报告 ,以 声明 满足 测试 出 口 准则 或 者 尚未 满足 出 口 准则 
的 具体 原因 。 在 低级 别 的 测试 中 ,例如 组 件 测试 .集成 测试 ,测试 报告 的 形式 可 以 是 向 项 
目 经 理 汇报 的 关于 达到 了 出 口 准 则 的 一 些 简单 的 信息 。 而 在 高 级 别 的 测试 中 ,例如 系统 
测试 或 验收 测试 ,需要 提交 正式 的 测试 报告 。 

测试 级 别 不 同 , 其 测试 报告 的 内 容 也 可 以 不 同 。 例 如 组 件 测试 报告 和 系统 测试 报 
告 ,它们 在 提交 人 ,读者 .报告 产 生 的 阶段 .报告 的 关注 点 ,报告 的 依据 和 报告 审核 人 等 方 
面 都 可 能 是 不 同 的 。 

测试 报告 中 描述 的 结论 来 自 相关 测试 活动 的 记录 文档 ,而 不 是 凭空 得 出 的 。 测 试 报 
告 需要 参考 的 文档 主要 有 测试 计划 、 测 试 设计 说 明 、 测 试用 例 说 明 、 测 试 规程 说 明 、 事 件 
报告 和 测试 日 志 等 。 测 试 报告 中 需要 对 度量 数据 进行 分 析 , 常 用 的 度量 数据 有 测试 用 例 
执行 度量 数据 缺陷 度 量 数据 ,覆盖 率 度量 数据 等 。 


1.4.5 测试 结束 活动 


所 有 测试 执行 活动 完成 并 输出 测试 报告 后 ,并 不 意味 着 测试 活动 全 部 结束 。 测 试 经 
理 和 测试 团队 其 他 成 员 需 要 归档 测试 工作 产品 ,例如 测试 设计 说 明 、 自 动 化 测试 脚本 等 ， 
同时 对 测试 过 程 和 测试 活动 中 产生 的 数据 进行 收集 和 分 析 , 总 结 测试 过 程 和 测试 活动 的 
经 验 教训 。 例 如 测试 活动 是 否 实现 了 测试 计划 设 定 的 目标 有 哪些 非 期 望 的 事情 和 风险 
发 生 、 发 生 的 原因 是 什么 、 是 否 有 效 地 解决 了 这 些 风险 、 是 否 存在 没有 解决 的 变更 请 

测试 结束 活动 阶段 分 析 测 试 数据 的 主要 目的 是 让 测试 团队 成 员 了 解 测试 过 程 中 的 
经 验 和 教训 ,从 而 可 以 帮助 测试 团队 在 以 后 的 测试 中 不 再 重复 错误 。 同 时 ,这 些 经 验 教 
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训 也 可 以 帮助 其 他 项 目 团 队 改 进 他 们 的 开发 测试 过 程 ,以 及 提高 项 目的 质量 。 通 过 测 
试 过 程 的 评估 (包括 测试 任务 、 所 花费 资源 和 所 达到 结果 的 鉴定 评估 ) 可 以 发 现 哪些 方 
面 需 要 进一步 改进 。 把 这 些 发 现 结果 使 用 在 以 后 的 项 目 中 ,可 以 帮助 后 继 项 目的 持续 
改进 。 

测试 结束 活动 主要 集中 在 以 下 几 个 方面 。 

(1) 确保 所 有 的 测试 工作 全 部 完成 。 例 如 所 有 计划 的 测试 都 已 经 执行 .提交 的 缺陷 
已 经 修改 并 且 进 行 了 相应 的 确认 测试 和 回归 测试 ,或 者 经 过 项 目 团队 的 风险 分 析 , 缺 陷 
留 到 下 个 版 本 解决 。 

(2) 移交 测试 工作 产品 。 将 测试 文档 和 测试 环境 等 移交 给 后 续 团 队 ( 如 维护 测试 团 
队 ) ,并 将 所 有 测试 工作 产品 归档 。 

(3) 总 结 经 验 教训 。 总 结 测试 过 程 中 的 经 验 教训 并 进行 文档 化 ,以 避免 在 以 后 的 测 
试 中 重复 这 些 错误 。 例 如 : 

Q@ 实际 的 工作 量 和 原来 估算 的 工作 量 差 距 很 大 。 查 找 其 中 的 原因 ,在 以 后 项 目的 工 
作 量 估算 中 考虑 这 些 因 素 , 可 以 提高 估算 的 准确 性 。 

@ 测试 执行 的 后 期 ,在 某 个 模块 中 发 现 了 大 量 的 缺陷 。 通 过 分 析 引 起 缺陷 的 原因 ， 
发 现 项 目 后 期 的 变更 请 求 影 响 了 分 析 和 开发 的 质量 。 因 此 在 后 继 项 目 中 应 该 更 好 地 管 
理 变更 请 求 。 

@ 在 高 级 别 的 测试 中 发 现 大 量 缺 陷 , 通 过 分 析 后 发 现 ,是 由 于 裁减 了 低级 别 的 测试 
造成 的 ,增加 了 发 现 和 修复 缺陷 的 成 本 。 在 以 后 的 项 目 中 .对 低 测 试 级 别 的 裁剪 应 该 进 
行 更 严格 的 评估 ,以 保证 提高 测试 效率 。 

(4) 收集 和 分 析 测 试 过 程 相 关 的 度量 信息 进行 测试 过 程 的 改进 。 

(5) 测试 团队 成 员 表 彰 。 为 了 达到 测试 目标 和 按时 完成 进度 ,测试 团队 付出 了 极 大 
的 努力 ,在 测试 结束 阶段 对 测试 团队 成 员 进行 表彰 ,能 够 鼓舞 大 家 的 士气 ,使 得 所 有 成 员 
在 下 一 个 项 目 中 能 够 投入 更 大 的 热情 。 

这 些 测试 结束 活动 是 非常 重要 的 ,而 在 实际 项 目 过 程 中 却 常 常 被 遗漏 。 因 此 ,应 该 
将 测试 结束 活动 明确 包含 在 测试 计划 中 。 测 试 结束 活动 的 主要 输入 包括 : 

(1) 测试 计划 ,例如 测试 计划 中 的 工作 量 估 算 、 风 险 分 析 、 采 用 的 测试 设计 技术 以 及 
测试 需求 分 析 等 。 

(2) 测试 用 例 完成 数目 ,包括 设计 和 执行 的 测试 用 例 的 数目 ,以 及 未 执行 的 测试 用 例 
数目 等 。 

(3) 缺陷 数目 ,包括 发 现 的 缺陷 数目 、 修 改 的 缺陷 数目 .未 修改 的 缺陷 数目 等 。 

(4) 缺陷 分 布 趋势 ,包括 缺陷 发 现 的 趋势 ,缺陷 修改 的 趋势 ,缺陷 在 不 同 模块 不同 测 
试 类 型 等 的 分 布 趋势 等 。 

(5) 测试 团队 成 员 的 周 工作 报告 和 月 工作 报告 等 。 

测试 结束 活动 的 主要 输出 包括 : 

(1) 测试 经 验 教训 总 结 ; 
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(2) 测试 过 程 改进 建议 ; 
(3) 归档 的 测试 工作 产品 。 


(5 测试 心理 学 


只 要 是 人 就 会 犯错 误 , 而 由 人 编写 的 文档 和 代码 中 就 会 有 缺陷 ,测试 的 一 个 重要 目 
的 是 尽早 发 现 缺陷 ,并 以 缺陷 报告 的 形式 提交 给 开发 人 员 进 行 修复 。 本 章节 主要 介绍 测 
试 的 心理 学 以 及 如 何 利 用 测试 心理 学 更 好 地 实现 测试 团队 与 开发 团队 的 紧密 合作 。 

“开发 人 员 可 以 测试 他 们 自己 开发 的 程序 吗 ?" 是 一 个 经 常 被 问 到 且 确 实 重要 的 问 
题 。 通 常 认为 软件 开发 是 建设 性 的 行为 ,而 软件 测试 是 破坏 性 的 行为 。 测 试 中 使 用 的 思 
维 方式 ,与 在 项 目 分 析 和 开发 中 使 用 的 不 同 。 具 有 正确 思维 方式 的 开发 人 员 可 以 测试 他 
们 自己 写 的 代码 。 但 是 他 们 需要 非常 审慎 地 检查 他 们 自己 的 测试 工作 ,因为 开发 人 员 经 
常 更 容易 以 正 向 思维 的 方式 进行 测试 工作 。 又 有 谁 愿意 去 证 明 自 己 开发 的 代码 中 存在 
很 多 错误 呢 ? 他 们 更 愿意 证 明 自己 的 代码 是 可 以 出 色 工作 的 。 因 此 ,将 测试 职责 从 开发 
人 员 转 移 给 测试 人 员 ,保持 测试 的 独立 性 ,不 仅 有 助 于 开发 人 员 集 中 精力 ,而 且 具 备 一 些 
其 他 的 额外 优势 ,例如 通过 培训 和 使 用 专业 的 测试 资源 获得 的 独立 的 观点 。 

保持 一 定 程度 的 测试 独立 性 ,不 仅 可 以 避免 开发 人 员 对 自己 代码 的 偏爱 ,通常 情况 
下 也 可 以 更 加 高 效 地 发 现 软件 缺陷 和 软件 中 存在 的 失效 。 但 是 保持 测试 的 独立 性 ,并 不 
是 说 开发 人 员 不 能 在 他 们 自己 编写 的 代码 中 找 出 缺陷 。 相 反 , 由 于 开发 人 员 在 开发 过 程 
中 对 测试 对 象 的 深入 了 解 , 他 们 同样 也 可 以 高 效 地 在 他 们 自己 的 代码 中 找 出 很 多 缺陷 。 

独立 测试 可 以 应 用 于 任何 测试 级 别 , 且 在 不 同 的 测试 上 下 文中 可 以 表现 为 不 同 级 别 
的 测试 独立 性 。 下 面 罗列 了 从 低 到 高 定义 的 不 同 级 别 的 测试 独立 性 。 

(1) 测试 由 软件 本 身 编写 的 人 员 来 执行 ,是 低级 别 的 测试 独立 性 。 

(2) 测试 由 一 个 其 他 开发 人 员 ( 例 如 来 自 同一 开发 小 组 的 人 员 ) 来 执行 。 

(3) 测试 由 组 织 内 的 一 个 或 多 个 其 他 小 组 成 员 (例如 独立 的 测试 小 组 ) 或 测试 专家 
(例如 可 用 性 或 性 能 测试 专家 ) 来 执行 。 

(4) 测试 由 来 自 其 他 组 织 或 其 他 公司 的 成 员 来 执行 (例如 测试 外 包 或 其 他 外 部 组 织 
的 鉴定 )。 

测试 目标 驱使 测试 小 组 的 成 员 组 成 和 测试 活动 。 测 试 小 组 成 员 将 根据 管理 层 或 者 
其 他 利益 相关 者 的 目标 对 测试 计划 进行 调整 ,例如 需要 发 现 更 多 的 缺陷 ,或 确认 软件 是 
否 满足 其 质量 目标 。 因 此 ,清晰 地 设 定 测试 目标 是 非常 重要 的 。 

测试 过 程 中 发 现 的 缺陷 和 失效 ,经 常会 被 看 作 是 测试 人 员 对 产品 和 作者 的 指责 ,从 
这 个 层面 看 ,测试 通常 被 认为 是 破坏 性 的 活动 。 但 是 测试 在 管理 被 测 对 象 的 产品 风险 方 
面 是 非常 有 建设 性 作用 的 。 测 试 过 程 中 发 现 被 测 对 象 中 的 失效 ,需要 测试 人 员 具 备 一 颗 
好 奇 心 , 专 业 的 怀疑 态度 一双 挑剔 的 眼睛 、 对 细节 的 关注 .与 开发 人 员 进行 良好 沟通 的 
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能 力 ,以 及 对 常见 的 错误 进行 判断 的 技能 和 经 验 。 

尽管 测试 过 程 中 发 现 的 缺陷 和 失效 ,会 被 看 成 是 一 种 破坏 性 的 活动 ,但 是 测试 人 员 
可 以 以 建设 性 的 态度 ,与 分 析 人 员 ,设计 人 员 和 开发 人 员 进 行 缺陷 或 失效 的 沟通 ,以 避免 
团队 成 员 之 间 的 不 愉快 。 团 队 之 间 进 行 建设 性 的 沟通 ,不 仅 适用 于 软件 工作 产品 的 评审 
过 程 ,同样 也 适用 于 动态 测试 过 程 。 

以 建设 性 的 方式 讨论 缺陷 .进度 和 风险 的 时 候 , 测 试 团队 成 员 都 需要 具有 良好 的 人 
与 人 之 间 沟 通 的 能 力 。 从 开发 人 员 角 度 来 说 ,例如 软件 代码 或 者 文档 的 作者 ,测试 人 员 
发 现 的 缺陷 信息 可 以 帮助 他 们 提高 技术 水 平 。 同 时 ,在 测试 阶段 发 现 和 修复 缺陷 ,可 以 
为 项 目 后 期 节约 时 间 和 成 本 ,同时 降低 风险 。 

团队 之 间 经 常会 发 生 沟通 相关 的 问题 ,特别 是 当 测 试 人 员 只 是 被 视 为 不 受 欢迎 的 缺 
陷 消息 的 传递 者 的 时 候 。 然 而 ,下 面 的 一 些 建议 .有 助 于 改善 测试 团队 成 员 和 其 他 团队 
成 员 之 间 的 沟通 和 相互 关系 。 

(1) 以 合作 而 不 是 争斗 的 方式 开始 项 目 , 时 时 提醒 项 目的 每 位 成 员 : 大 家 的 共同 目 
标 是 追求 高 质量 的 产品 。 

(2) 对 产品 中 发 现 的 问题 以 中 性 的 和 以 事实 为 依据 的 方式 来 沟通 ,而 不 要 指责 引入 
这 个 问题 的 小 组 成 员 或 个 人 。 例 如 ,客观 而 实际 地 编写 缺陷 报告 和 评审 发 现 的 问题 。 

(3) 尽量 理解 其 他 成 员 的 感受 ,以 及 他 们 为 什么 会 有 这 种 反应 。 

(4) 确信 其 他 成 员 已 经 理解 你 的 描述 ,反之 亦 然 。 


(1.6 职业 道德 


在 软件 测试 中 包含 了 使 个 人 可 以 获取 保密 的 、 授 权 的 信息 。 为 保证 信息 规范 化 使 
用 ,需要 遵循 必要 的 职业 道德 。ISTQB 借鉴 .引用 了 ACM 和 IEEE 对 于 工程 师 的 道德 规 
范 , 陈 述职 业 道 德 规范 如 下 。 

(1) 公共 一 一 认证 测试 工程 师 应 当 以 公众 利益 为 目标 。 

(2) 客户 和 雇主 一 一 在 保持 与 公众 利益 一 致 的 原则 下 ,认证 测试 工程 师 应 注意 满足 
客户 和 雇主 的 最 高 利益 。 

(3) 产品 一 一 认证 测试 工程 师 应 当 确 保 他 们 提供 的 (在 产品 和 系统 中 由 他 们 测试 的 ) 
发 布 版 本 符合 最 高 的 专业 标准 。 

(4) 判断 一 一 认证 测试 工程 师 应 当 维护 他 们 职业 判断 的 完整 性 和 独立 性 。 

(5) 管理 一 一 认证 软件 测试 管理 人 员 和 测试 领导 人 员 应 赞成 和 促进 对 软件 测试 合乎 
道德 规范 的 管理 。 

(6) 专业 
性 和 声誉 。 

(7) 同事 一 一 认证 测试 工程 师 对 其 同事 应 持平 等 .互助 和 支持 的 态度 ,并 促进 与 软件 


在 与 公众 利益 一 致 的 原则 下 ,认证 测试 工程 师 应 当 推进 其 专业 的 完整 
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开发 人 员 的 合作 。 
(8) 自我 一 一 认证 测试 工程 师 应 当 参 与 终生 职业 实践 的 学 习 , 并 促进 合乎 道德 的 职 
业 实践 方法 。 


(1.7 习题 


1.(K2) 下 列 哪 项 对 于 测试 的 描述 是 正确 的 ? 〈 ) 
A. 程序 中 有 缺陷 ,就 肯定 会 在 外 部 有 所 反应 ,这 就 是 ISTQB 所 说 的 失效 
B. 当 程 序 期 望 结果 和 实际 结果 有 所 偏差 时 ,可 以 肯定 的 就 是 由 程序 内 的 缺陷 引起 的 
C， 人 为 的 错误 造成 程序 内 的 缺陷 ,而 程序 内 的 缺陷 可 能 会 成 为 失效 
D. 如 果 没 有 发 现 失 效 ,也 就 表示 程序 没有 缺陷 
2，(K2) 按 照 风险 设 定 测试 用 例 的 优先 级 并 按照 优先 级 顺序 进行 测试 ,符合 测试 的 
哪个 基本 原则 ? (  ) 
A. 测试 只 能 显示 缺陷 的 存在 
B. 穷尽 测试 是 不 可 能 的 
C. 杀 虫 剂 悖 论 
D. 缺陷 集群 性 
3，(K1) 下 面 的 哪 项 不 属于 基本 测试 过 程 的 计划 和 控制 步骤 的 任务 ? (  ) 
A. 定义 人 口 和 出 口 准则 
B. 选择 合适 的 度量 项 
C. 确定 测试 的 范围 和 风险 
D. 创建 测试 设计 规范 说 明 
4.(K1) 关 于 独立 测试 的 描述 ,下 面 哪个 是 错误 的 ? ( ) 
A. 独立 测试 通常 可 以 更 高 效 地 发 现 软件 缺陷 和 软件 存在 的 失效 
B. 软件 测试 往往 需要 与 软件 开发 不 同 的 思维 方式 
C. 测试 通常 被 认为 是 破坏 性 的 活动 ,而 软件 开发 通常 被 认为 是 建设 性 的 活动 
D. 独立 测试 只 可 应 用 在 高 级 别 的 测试 活动 中 ,如 系统 测试 和 验收 测试 
5，(K1) 下 列 关于 错误 .缺陷 和 失效 的 观点 正确 的 是 ( i 
A. 人 都 会 犯错 误 ,因此 由 人 设计 的 程序 也 会 有 缺陷 
B. 所 有 的 缺陷 都 会 产生 失效 
C. 失效 主要 是 由 人 的 错误 造成 的 ,和 环境 条 件 没有 关系 
D. 当 存 在 缺陷 的 代码 被 执行 时 , 才 可 能 引发 软件 错误 
6. (Kl) 以 下 哪个 不 属于 软件 测试 在 开发 ,维护 和 运行 中 能 够 起 到 的 作用 ? ( ) 
A. 可 以 减少 软件 系统 在 运行 环境 中 的 风险 
B. 可 以 提高 软件 系统 的 质量 
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可 能 更 好 地 满足 合同 或 法 律 法 规 的 要 求 

. 可 以 用 于 评价 开发 团队 的 能 力 

(K1) 在 判断 测试 是 否 足 够 时 ,下 列 哪些 方面 是 不 需要 考虑 的 ?( ) 
风险 

项 目 在 时 间 上 的 限制 

项 目 在 预算 上 的 限制 

. 投入 的 测试 人 员 的 数量 

(K1) 以 下 哪个 不 是 软件 测试 的 目标 ? 〈 ) 

. 发 现 缺 陷 

增加 对 质量 的 信心 

为 决策 提供 信息 

.改进 测试 流程 

(K2) 下 列 关于 不 同 的 测试 阶段 的 描述 哪个 是 错误 的 ?( ) 

. 维护 测试 通常 是 为 了 验证 开发 过 程 发 现 的 缺陷 是 否 被 正确 修复 

组 件 测试 的 主要 目标 是 尽 可 能 地 发 现 失效 ,从 而 识别 和 修正 尽 可 能 多 的 缺陷 
验收 测试 的 主要 目标 是 确认 系统 是 否 按照 预期 工作 ,是 建立 满足 了 需求 的 信心 
. 不 同 的 测试 阶段 ,其 测试 目标 是 不 同 的 

10. (K2) 软 件 测试 基本 过 程 由 哪些 主要 活动 组 成 ?( 

(1) 计划 和 控制 

(2) 分 析 和 设计 

(3) 实现 和 执行 

(4) 评估 出 口 准则 和 报告 

(5) 测试 结束 活动 

A. CLYIC3Y C5) 

B: CD 273) 

> os 

;CINCO CB ANC) 

11.〈K2) 规 划 测 试 环境 和 确定 测试 需要 的 基础 设施 和 工具 属于 下 面 的 哪个 活动 ? 


pn 


-| 


DAR>PINmF>PINm 


= 


A. 计划 和 控制 
B. 分 析 和 设计 
C. 实现 和 执行 
D. 评估 出 口 准则 和 报告 
2.(K1) ISTQB 软件 测试 术语 中 ,与 失效 (Failure) 、 错 误 (Error) 、 缺 陷 (Defect) 几 
个 术语 的 同义词 分 别 是 ? ( 和 
A. Fail .Mistake、Bug 


ed 


~ 
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B. Fail\Fault、Bug 

C. Fault, Mistake. Bug 

D. Fault\Bug Mistake 

13. (K2) 某 通信 公司 购买 了 某 个 产 商 的 ADSL MODEM 作为 客户 上 网 的 客户 端 , 公 
司 计 划 对 ADSL MODEM 进行 一 次 验收 测试 。 你 认为 下 面 哪个 原因 是 实施 验收 测试 的 
直接 原因 ? ( ) 

A. 尽量 发 现 ADSL MODEM 中 的 缺陷 

B. 确保 ADSL MODEM 没有 缺陷 

C. 确保 ADSL MODEM 符合 公司 的 安全 性 要 求 

D. 确保 ADSL MODEM 可 以 按照 预期 正常 工作 

14. (K2) 在 软件 产品 发 布 给 客户 之 后 ,在 6 个 月 内 从 用 户 使 用 现场 反馈 的 缺陷 数 
目 ,大 概 是 总 缺陷 数目 的 5%, 即 测试 过 程 中 缺陷 发 现 比例 大 概 在 95%。 尽 管 缺 陷 的 发 
现 率 已 经 很 高 了 ,但 是 高 层 经 理 对 此 并 不 满意 。 你 认为 下 面 的 哪个 测试 基本 原则 可 以 帮 
助 你 说 服 高 层 经 理 的 误解 ? 1 

A. 缺陷 的 集群 效应 

B. 穷尽 测试 是 不 可 能 的 

C. 杀 虫 剂 悖 论 

D. 测试 可 以 显示 缺陷 的 存在 ,不 能 证 明 系 统 不 存在 缺陷 

15.(K1) 你 认为 “软件 测试 的 7 个 基本 原则 ”, 可 以 应 用 在 ISTQB 的 哪个 测试 阶段 ? 


A. 测试 分 析 与 设计 阶段 

B. 测试 实现 与 执行 阶段 

C. 测试 出 口 准则 评估 与 报告 阶段 

D. 适用 于 整个 测试 生命 周期 

16. (K1) 在 软件 项 目的 早期 就 开始 制订 测试 计划 ,你 认为 这 体现 了 哪个 测试 目的 ? 


A. 检测 缺陷 
B. 证 明 软 件 系统 可 以 正常 工作 
C. 预防 缺陷 
D. 通过 动态 测试 发 现 缺 陷 
17. (K2) 在 组 件 测试 和 集成 测试 执行 过 程 中 ,测试 人 员 希 望 尽量 多 地 发 现 测试 对 象 
的 失效 ,其 目的 是 为 了 ( 站 
A. 验证 测试 过 程 中 发 现 的 缺陷 是 否 真 的 得 到 了 修改 
B. 识别 和 修改 尽量 多 的 缺陷 
C. 确认 测试 对 象 是 否 可 以 正确 工作 
D. 过 程 改 进 
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18.〈K1) 一 个 测试 用 例 通常 包括 ( js 

1) 前 置 条 件 2) 输入 3) 预期 行为 ”4) 预期 结果 

A 1 

B. L273 

G, LY 2 

D. 4) 

19. (K2) 为 了 更 多 地 发 现 被 测 对 象 中 的 缺陷 ,测试 人 员 需 要 不 断 对 测试 用 例 进行 评 
审 和 更 新 。 该 论点 体现 了 哪个 测试 基本 原则 ? ( ) 

A. 穷尽 测试 不 可 能 

B. 杀 虫 剂 悖 论 

C. 缺陷 集群 效应 

D. 测试 的 尽早 介入 


本 


人 


一 中 wh 


学 习 目 标 描述 
应 用 具体 项 目 和 产品 类 型 的 例子 解释 在 开发 生命 周期 中 开发 、 
测试 活动 与 工作 产品 之 间 的 关系 
知道 必须 根据 项 目 背 景 和 产品 特征 来 选择 软件 开发 的 模型 
理解 在 任何 生命 周期 模型 中 良好 的 测试 应 具备 的 特征 
比较 不 同 测试 级 别 之 间 的 区 别 : 测试 的 主要 目的 、 典 型 的 测试 
对 象 . 典 型 的 测试 目标 (功能 性 的 或 结构 性 的 )、 相 关 的 工作 产 
品 、 测 试 的 人 员 ,识别 缺陷 和 失效 的 种 类 
通过 举例 比较 4 种 不 同 的 软件 测试 类 型 (功能 测试 , 非 功能 测 
试 , 结 构 测 试 和 与 变更 相关 的 测试 ) 
明白 功能 测试 和 结构 测试 可 以 应 用 在 任何 测试 级 别 
根据 非 功 能 需求 来 识别 和 描述 非 功 能 测试 的 类 型 
根据 对 软件 系统 结构 或 构架 的 分 析 来 识别 和 描述 测试 的 类 型 
描述 确认 测试 和 回归 测试 的 目的 
比较 维护 测试 (一 个 现存 系统 的 测试 ) 与 一 个 新 的 应 用 软件 的 测 
试 在 测试 类 型 ,测试 的 触发 和 测试 规模 等 方面 的 区 别 
识别 维护 测试 的 原因 (由 于 修改 移植 或 退役 等 因素 ) 
描述 回归 测试 和 变更 的 影响 分 析 在 软件 维护 中 的 作用 
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术语 


术 语 含 义 解 释 


Commercial Off-The-Shelf Software 的 缩写 ,参见 off- 
So 商业 现货 软件 The-Shelf Software 


Off-The-Shelf 现货 软件 面向 大 众 市 场 ( 即 大量 用 户 ) 开 发 的 软件 产品 ,并且 以 
Software 相同 的 形式 交付 给 许多 客户 


一 种 开发 生命 周期 : 项 目 被 划分 为 大 量 迭 代 过 程 。 一 
Tterative Development 和 迭代 开发 模型 次 先 代 是 一 个 完整 的 开发 循环 ,并 (对 内 或 对 外 ) 发 布 
Model 一 个 可 执行 的 产品 ,这 是 正在 开发 的 最 终 产品 的 一 个 


子 集 ,通过 不 断 迭 代 得 到 最 终 成 型 的 产品 


一 种 开发 生命 周期 : 项 目 被 划分 为 一 系列 增 量 ,每 一 
增 量 都 交付 整个 项 目 需求 中 的 一 部 分 功能 。 需 求 按 
Incremental 增 量 开发 模 开 优先 级 进行 划分 ,并 按 优先 级 在 适当 的 增 量 中 交付 。 
Development Model 在 这 种 生命 周期 模型 的 一 些 版 本 中 (但 不 是 全 部 ) ,每 
个 子 项 目 均 遵 循 “微型 的 V 模型 ", 具 有 自 有 的 设计 、 


编码 和 测试 阶段 


通过 检查 和 提供 客观 证 据 来 证 实 特定 目的 功能 或 应 


Validation 确认 用 已 经 实现 


通过 检查 和 提供 客观 证 据 来 证 实 指定 的 需求 是 否 已 


Verification 验证 经 满足 


描述 从 需求 定义 到 维护 的 整个 软件 开发 生命 周期 活 
V-model V- 模 型 动 的 框架 ,V 模型 说 明了 测试 活动 如 何 集成 于 软件 开 
发 生命 周期 的 每 个 阶段 


由 潜在 用 户 或 者 独立 的 测试 团队 在 开发 环境 下 或 者 
模拟 实际 操作 环境 下 进行 的 测试 ,通常 在 开发 组 织 之 
外 进行 。 通常 是 对 现货 软件 (Off -The -Shelf 
Software) 进 行内 部 验收 测试 的 一 种 方式 


Alpha Testing Alpha 测试 


潜在 或 现 有 用 户 /客户 在 开发 组 织 以 外 的 场所 ,没有 
开发 人 员 参 与 的 情况 下 进行 的 测试 ,检验 软件 是 否 满 
足 客户 及 业务 需求 。 这 种 测试 经 常 是 为 了 获得 市 场 
反馈 对 现货 软件 进行 外 部 验收 测试 的 一 种 形式 


Beta Testing Beta 测试 


Component Testing 组 件 测试 对 单个 的 软件 组 件 进行 测试 


代替 某 个 软件 组 件 来 模拟 控制 和 /或 调用 其 他 组 件 或 


避 坟 村 系统 的 软件 或 测试 工具 


Field Testing 现场 测试 参见 Beta Testing 


Functional 


功能 需求 指定 组 件 /系统 必须 实现 某 项 功能 的 需求 
Requirement 


Integration 集成 把 组 件 / 系 统合 并 为 更 大 部 件 的 过 程 


一 种 旨 在 暴露 接口 以 及 集成 组 件 / 系 统 间 交互 时 存在 
Integration Testing 集成 测试 的 缺陷 的 测试 ,参见 Component Integration Testing， 
System Integration Testing 
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续 表 
术 语 含 本 解 释 
Component 为 发 现 集成 组 件 接口 之 间 和 集成 组 件 交互 产生 的 缺 
JIntegration Testing 组 件 集成 测试 陷 而 执行 的 测试 
System 测试 系统 和 包 的 集成 ; 测试 与 外 部 组 织 ( 如 : 电子 数 
Integration Testing 系统 集成 测试 据 交换 、 国 际 互联 网 ) 的 接口 
Non-Functional 非 功能 需求 与 功能 性 无 关 , 但 与 可 靠 性 效率 、 易 用 性 、 可 维护 性 
Requirement 和 可 移植 性 等 属性 相关 的 需求 
Robustness Testing 健壮 性 测试 判定 软件 产品 健壮 性 的 测试 
一 个 软件 组 件 框架 的 实现 或 特殊 目的 的 实现 ,用 于 开 
Stub 桩 发 和 测试 另 一 个 调用 或 依赖 于 该 组 件 的 组 件 , 它 代替 
了 被 调用 的 组 件 
System Testing 系统 测试 测试 集成 系统 以 验证 它 是 否 满足 指定 需求 的 过 程 
执行 测试 需要 的 环境 ,包括 硬件 、 仪 器、 模拟 器 .软件 
Test Environment 测试 环境 工具 和 其 他 支持 要 素 
统一 组 织 和 管理 的 一 组 测试 活动 。 测 试 级 别 与 项 目 
Test Level 测试 级 别 的 职责 相关 联 。 例 如 ,测试 级 别 有 组 件 测试 集成 测 
试 、 系 统 测试 和 验收 测试 
Test Driven 在 开发 软件 之 后 ,运行 测试 用 例 之 前 ,首先 开发 并 自 
ee 测试 于 动 开发 。 | 动 化 这 些 测试 用 例 的 一 种 软件 开发 方法 
一 般 由 用 户 /客户 进行 的 确认 是 否 可 以 接受 一 个 系统 的 
Acceptance Testing 验收 测试 验证 性 测试 ,是 根据 用 户 需 求 ,业务 流程 进行 的 正式 测试 
以 确保 系统 符合 所 有 验收 准则 
Black-Box Testing 黑 盒 测试 不 考虑 组 件 或 系统 内 部 结构 的 功能 或 非 功能 测试 
一 种 分 析 方法 ,用 于 确定 软件 的 哪些 部 分 被 测试 套件 
Code Coverage 代码 覆盖 材 盖 到 了 ,哪些 部 分 没有 。 包 括 语句 覆盖 ,判定 覆盖 
和 条 件 覆盖 
. 通过 对 组 件 / 系 统 功能 说 明 的 分 析 而 进行 的 测试 , 参 
Functional Testing 功能 测试 见 Black-Box Testing 
Eee 互 操作 性 测试 判定 软件 产品 可 交互 性 的 测试 过 程 , 参见 
Testing Functional Testing 
一 种 通过 增加 负载 来 评估 组 件 或 系统 性 能 的 测试 方 
法 。 例 如 通过 增加 并 发 用 户 数 和 (或 ) 事 务 数量 来 测 
量 组 件 或 系统 能 够 承受 的 负载 ,参见 Performanee 
Testing，Stress Testing 
ee 维护 性 测试 。 。 | 判定 软件 产品 的 可 维护 性 的 测试 过 程 
Testing 
了 Performance Testing 性 能 测试 判定 软件 产品 性 能 的 测试 过 程 ,参见 Efficiency Testing 
Portability Testing 可 移植 性 测试 判定 软件 产品 可 移植 性 的 测试 过 程 
Reliability Testing 可 靠 性 测试 判定 软件 产品 可 靠 性 的 测试 过 程 
Security Testing 安全 性 测试 判定 软件 产品 安全 性 的 测试 
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续 表 
术 语 会 义 解 释 
当 工作 量 等 于 或 超过 规定 量 ,或 可 用 资源 少 于 预期 
_ (如 能 访问 的 存储 和 服务 器 ) 时 ,用 于 评估 组 件 或 系统 
Sogn Yestng 压力 测试 的 一 种 性 能 测试 方法 。 参 见 Performance Testing， 
Load Testing 
Structural Testing 结构 测试 参见 White-Box Testing 
Efficiency Testing 效率 测试 确定 软件 产品 效率 的 测试 过 程 
用 来 判定 软件 产品 的 可 理解 ,易学 、 易 操作 和 在 特定 
Usability Testing 易 用 性 测试 条 件 下 吸引 用 户 程度 的 测试 
White-Box Testing 白 盒 测 试 通过 分 析 组 件 /系统 的 内 部 结构 进行 的 测试 
对 需求 变更 所 造成 的 开发 文档 、 测 试 文档 和 组 件 的 修 
Impact Analysis 影响 分 析 改 的 评估 
: 针对 运行 系统 的 更 改 ,或 者 新 的 环境 对 运行 系统 的 影 
Maintenance Testing 维护 测试 响 而 进行 的 测试 


Ca 软件 开发 模型 


为 了 使 软件 开发 的 工作 系统 化 并 且 可 控制 ,需要 采用 合适 的 软件 开发 模型 和 开发 过 
程 管理 所 有 的 活动 。 软 件 开发 模型 有 多 种 ,例如 瀑布 模型 、V- 模 型 .螺旋 模型 以 及 其 他 各 
类 增 量 迭代 模型 ,还 有 目前 流行 的 “敏捷 ?或 者 *“ 轻 量 级 模型。 软件 开发 模型 定义 了 系统 
化 的 方式 ,以 达到 工程 项 目 中 工作 的 有 序 。 

多 数 情况 下 ,软件 开发 模型 定义 了 软件 开发 过 程 的 各 个 工作 阶段 和 步骤 ,每 个 阶段 
和 步 又 完成 后 将 输出 软件 工作 产品 ,例如 以 文档 或 代码 的 形式 呈现 。 软 件 开发 模型 中 一 
个 阶段 的 完成 ,通常 称 为 里 程 碑 , 它 的 实现 是 指 完成 了 需要 的 交付 物 并 且 与 要 求 的 质量 
标准 保持 一 致 。 通 常 , 在 软件 开发 中 需要 定义 专注 于 特定 任务 的 角色 。 有 时 候 ,还 需要 
描述 在 特定 阶段 用 到 的 技术 和 过 程 。 使 用 模型 有 助 于 资源 计划 (例如 时 间 、 人 员 、 基 础 设 
施 等 ) 的 细 化 。 软 件 开发 模型 定义 了 参与 项 目的 每 个 人 需要 完成 的 任务 ,以 及 完成 这 些 
任务 的 时 间 顺 序 。 

测试 不 是 孤立 存在 的 ,测试 是 各 种 软件 开发 模型 中 的 重要 组 成 部 分 ,测试 活动 与 开 
发 活动 是 息息相关 的 。 不 同 的 软件 开发 模型 定义 了 不 同 的 测试 阶段 、 测 试 活动 和 测试 方 
法 。 下 面 介绍 一 些 常见 的 软件 开发 模型 。 


38 


A 


软件 测试 基础 教程 


2.1.1 瀑布 模型 


瀑布 模型 最 早 由 Winston W. Royce 在 1970 年 提出 0, 它 在 软件 工程 中 占有 重要 的 
地 位 ,提供 了 软件 开发 的 基本 框架 。 从 测试 的 角度 而 言 ,瀑布 模型 最 大 的 缺点 是 : 测试 是 
软件 开发 过 程 中 的 一 个 阶段 ,测试 被 看 作 是 对 软件 产品 的 最 终 检 查 , 类 似 于 制造 业 中 将 
产品 交付 给 客户 之 前 的 检查 。 

如 图 2-1 所 示 是 一 个 传统 的 瀑布 模型 , 它 将 软件 开发 生命 周期 划分 为 系统 需求 
(System Requirement) 、 软 件 需求 (Software Requirement)、 分 析 (Analysis)、 程 序 设计 
(Program Design) ,编码 (Coding) ,测试 (Testing) 和 运行 (Operations)7 个 基本 阶段 ,并 
且 规 定 了 它们 自 上 而 下 、 相 互 衔接 的 固定 次 序 , 如 同 瀑布 流水 , 逐 级 下 落 。 从 本 质 来 说 ， 
它 是 一 个 软件 开发 架构 ,开发 过 程 是 通过 一 系列 阶段 顺序 展开 的 ,只 有 当 一 个 开发 阶段 
完成 后 ,下 一 个 开发 阶段 才 会 开始 。 
系统 需求 


(System Requirements) 部 | 


软件 需求 
(Software Requirements) 
1 
分 析 
(Analysis) 
1 
程序 设计 
(Program Design) 
编码 
(Coding) 
了 
测试 
(Testing) 
运行 
(Operations) 
图 2-1 瀑布 模型 


尽管 瀑布 模型 由 于 存在 一 些 缺 点 而 招致 很 多 的 批评 ,但 是 它 对 很 多 类 型 的 项 目 而 言 
依然 是 有 效 的 。 如 果 能 够 正确 使 用 瀑布 模型 ,可 以 节省 大 量 的 时 间 和 人 金钱。 是 否 采用 瀑 
布 模型 ,主要 取决 于 是 否 能 够 充分 理解 客户 的 需求 ,以 及 在 项 目 开 发 过 程 中 这 些 需求 是 
否 经 常 发 生变 更 。 对 于 需求 经 常 发 生变 更 的 项 目 , 采 用 瀑布 模型 是 不 合适 的 ,这 时 候 就 
需要 考虑 其 他 类 型 的 软件 开发 模型 。 


四 Royce，W. ，Managing the Development of Large Software Systems: Concepts and Techniques, Proc. IEEE 
WESCON, 1970. 
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2.1.2 V 模型 


V 模型 是 瀑布 模型 的 变种 , 它 体现 的 主要 思想 是 : 开发 任务 和 测试 任务 是 相互 对 等 
的 活动 且 同 等 重要 。V 模型 的 左右 两 侧 组 成 字母 V 的 两 个 边 ,形象 地 体现 了 这 一 点 。V 
模型 的 左 侧 代表 软件 开发 过 程 ,在 软件 开发 过 程 中 ,系统 是 逐步 设计 完善 的 ,编码 是 最 后 
一 步 。V 模型 的 右 侧 描述 了 相应 的 集成 和 测试 过 程 ,通过 不 断 组 合 软件 组 件 , 形 成 更 大 
的 子 系 统 (软件 组 件 的 集成 ) ,并 对 它们 的 功能 和 非 功能 进行 测试 。V 模型 将 测试 分 成 了 
不 同 的 级 别 , 分 别 是 组 件 测试 .集成 测试 ,系统 测试 和 验收 测试 。 每 个 不 同 的 测试 级 别 都 
有 各 自主 要 的 测试 关注 点 以 及 不 同 的 测试 目的 .2 

如 图 2-2 所 示 是 由 开发 活动 和 测试 活动 共同 组 成 的 V 模型 ,V 模型 主要 的 开发 活动 
有 需求 说 明 、 系 统 功能 设计 、 系 统 技 术 设 计 、 组 件 说 明 以 及 编码 ,相应 的 测试 级 别 有 组 件 
测试 ,集成 测试 、 系 统 测试 和 验收 测试 。 其 中 ,构成 V 模型 左 侧 的 活动 是 瀑布 模型 中 常见 
的 一 些 活动 。 

(1) 需求 说 明 : 从 客户 或 用 户 中 收集 需求 ,并 对 它们 进行 详细 描述 ,最 终 得 到 批准 和 
认可 。 需 求 说 明定 义 了 开发 软件 系统 的 目的 和 需要 实现 的 特性 和 功能 。 

(2) 系统 功能 设计 : 将 需求 映射 到 系统 的 功能 和 架构 上 。 

(3) 系统 技术 设计 : 设计 系统 的 具体 实现 方式 。 这 个 阶段 包括 定义 系统 环境 的 接 
口 ,同时 将 整个 系统 分 解 成 更 小 且 更 容易 理解 的 子 系统 (系统 架构 ), 从 而 可 以 对 每 个 子 
系统 进行 独立 的 开发 。 

(4) 组 件 说 明 : 定义 每 个 子 系统 的 任务 .行为 .内 部 结构 以 及 与 其 他 子 系统 的 
接口 。 

(5) 编码 : 通过 编程 语言 实现 所 有 已 经 定义 的 组 件 (例如 模块 .单元 .类 )。 


需求 说 明 验收 测试 


系统 功能 设计 PP | ”系统 测试 


系统 技术 设计 Fe 一 一 =| ”集成 测试 


、 


/ 
组 件 说 明 组 件 测试 


编码 


图 2-2 通用 V 模型 


D ANDREAS SPILLNER,TILO LINZ,HANS SCHAEFER,SOFTWARE TESTING FOUNDATIONS, 人 民 
邮电 出 版 社 ,2008-4-1. 
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在 V 模型 中 , 随 着 整个 开发 阶段 的 进行 ,软件 系统 的 描述 越 来 越 详 细 。 通 常 来 说 ,在 
某 个 开发 阶段 中 引入 的 缺陷 最 容易 在 本 阶段 中 发 现 。 因 而 ,在 每 个 开发 阶段 ,V 模型 的 
右边 定义 了 相应 的 测试 级 别 。 在 每 个 测试 级 别 ,都 要 检查 开发 的 输出 是 否 满足 具体 的 要 
求 , 或 者 是 否 满足 这 些 特定 阶段 相关 的 要 求 。 

(1) 组 件 测试 : 是 针对 一 个 软件 单元 的 测试 ,组 件 是 可 以 测试 的 最 小 软件 单元 ,有 些 
资料 或 书籍 中 也 将 组 件 测试 称 为 模块 测试 .单元 测试 ,类 测试 等 。 组 件 测试 是 检查 此 组 
件 是 否 满足 组 件 说 明 ( 详 细 设计 说 明 ) 的 要 求 , 即 保证 每 个 最 小 的 单元 能 够 正常 运行 。 组 
件 测试 一 般 由 开发 人 员 执 行 ,首先 设 定 最 小 的 测试 单元 ,然后 设计 相应 的 测试 用 例 检 查 
各 个 组 件 功能 的 正确 性 ,另外 还 要 考虑 组 件 的 健壮 性 ( 当 输 入 错误 数据 时 系统 的 反应 ) 和 
单个 组 件 的 性 能 。 

(2) 集成 测试 : 一 种 旨 在 暴露 接口 以 及 集成 组 件 或 集成 系统 间 交 互 时 存在 的 缺陷 的 
测试 。 测 试 的 目的 是 发 现 接口 的 缺陷 和 集成 后 组 件 /系统 协同 工作 时 的 缺陷 (如 与 操作 
系统 ,文件 系统 或 硬件 的 接口 等 )。 检 查 集成 后 的 组 件 /系统 是 否 能 按照 系统 技术 设计 描 
述 的 方式 协同 工作 ,接口 是 否 正确 等 。 

(3) 系统 测试 : 在 形成 完整 的 系统 后 ,对 整个 系统 进行 的 测试 称 为 系统 测试 ,系统 测 
试 旨 在 检查 系统 是 否 满足 了 指定 的 需求 。 在 V 模型 中 ,系统 测试 对 应 的 开发 输入 是 系统 
功能 设计 ,重点 是 检查 系统 所 定义 的 功能 是 否 实现 并 能 否 正确 运行 、 非 功能 的 质量 特性 
是 否 满足 了 设计 的 要 求 。 

(4) 验收 测试 : 一 般 由 用 户 / 客 户 进行 ,其 目的 是 确认 被 测 系统 是 否 满足 预先 定义 的 
验收 要 求 。 通 常 是 根据 用 户 需求 或 业务 流程 进行 的 正式 测试 以 确保 系统 符合 所 有 验收 
准则 。 


2.1.3 增 量 和 迭代 模型 


瀑布 模型 和 V 模型 是 顺序 模型 ,这 类 模型 的 一 个 重要 特点 是 模型 中 所 描述 的 活动 是 
顺序 的 。 顺 序 模 型 成 功 使 用 的 一 个 前 提 是 软件 系统 具备 完善 明确 的 需求 。 但 是 随 着 软 
件 开发 的 不 断 发 展 ,由 于 用 户 需 求 不 断 变化 、 开 发 周期 越 来 越 短 等 原因 ,顺序 模型 越 来 越 
无 法 满足 需要 。 人 们 很 难 在 项 目 开始 的 时 候 就 进行 完善 的 需求 分 析 和 设计 ,这 就 导致 在 
顺序 模型 中 要 不 断 地 进行 返工 ,对 以 前 的 需求 .设计 或 编码 进行 修改 。 为 了 解决 顺序 模 
型 的 这 些 不 足 , 出 现 了 增 量 和 迭代 模型 。 增 量 迁 代 模型 具有 以 下 特点 。 

(1) 能 适应 需求 的 不 断 变化 。 需 求 的 不 断 变 更 一 直 是 项 目 延 期 交付 、 令 客户 不 满意 
和 打击 开发 人 员 士 气 的 主要 原因 。 为 了 解决 这 个 问题 ,使 用 增 量 迭 代 模 型 的 团队 应 该 在 
项 目 开 发 的 前 期 就 关注 生成 和 演示 可 执行 的 软件 ,强制 进行 需求 检查 ,优先 实现 重要 和 

(2) 集成 不 是 在 项 目 后 期 进行 的 “大 动作 ”。 将 系统 的 集成 留 到 项 目的 后 期 ,几乎 总 
是 会 导致 耗 时 的 返工 ,有 时 这 种 返工 甚至 占 了 整个 项 目 40% 的 工作 量 。 为 了 避免 这 种 返 
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工 , 需 要 采用 持续 集成 的 方法 。 

(3) 早期 的 迭代 可 以 暴露 风险 。 早 期 的 迭代 可 以 覆盖 项 目 各 个 方面 的 内 容 , 例 如 工 
具 的 使 用 、 团 队 成 员 的 技能 等 。 并 且 团 队 可 以 在 早期 的 迭代 中 及 早 发 现 风险 ,并 进行 风 
险 的 评估 和 应 对 。 

(4) 更 好 地 应 对 产品 管理 的 挑战 。 采 用 增 量 迭代 模型 可 以 使 团队 快速 地 生成 可 执行 
的 锥 形 ( 虽 然 功能 有 限 )。 为 了 应 对 竞争 对 手 的 快速 版 本 发 布 ,这 个 锥 形 能 够 快速 地 调整 
产品 使 之 成 为 “ 轻 量 级 "或 者 “改进 型 "版 本 。 

(5) 重用 更 加 容易 。 早 期 的 设计 评审 允许 系统 架构 人 员 发 现 潜在 的 可 重用 的 机 会 ， 
并 且 利 用 这 个 机 会 为 接 下 来 的 迭代 开发 成 熟 的 公用 代码 。 

(6) 在 每 一 个 选 代 中 发 现 并 更 正 缺 陷 。 采 用 增 量 选 代 模 型 可 以 生成 健壮 的 架构 和 
高 质量 的 应 用 ,甚至 能 够 在 早期 的 迭代 中 而 不 是 在 项 目 末 期 的 大 规模 测试 阶段 发 现 
缺陷 。 

(7) 更 好 地 利用 项 目的 人 力 资源 。 很 多 开发 组 织 使 用 一 种 管道 式 的 组 织 方式 ,来 匹 
配 他 们 的 瀑布 开发 模型 : 分 析 人 员 将 完成 的 需求 发 送 给 设计 人 员 ,设计 人 员 将 完成 的 设 
计 发 送 给 开发 编程 人 员 ,编程 人 员 再 将 他 们 开发 的 软件 组 件 发 送 给 集成 人 员 , 集 成 人 员 
将 软件 组 件 集 成 子 系统 发 送 给 测试 人 员 测 试 。 这 种 多 次 的 传递 不 仅 容 易 产生 错误 而 且 
容易 造成 误解 ,同时 也 会 使 人 们 对 最 终 的 产品 缺少 责任 感 。 和 迭代 开发 过 程 鼓 励 团 队 成 员 
更 加 广泛 地 参与 项 目的 各 个 环节 ,允许 团队 成 员 扮 演 多 种 角色 。 因 此 ,项 目 经 理 能 够 更 
好 地 利用 项 目 人 员 并 可 以 减少 并 消除 有 风险 的 传递 。 

(8) 团队 成 员 技能 得 到 不 断 提 高 。 工 作 在 增 量 和 迭代 开发 模型 项 目 中 的 团队 成 员 ， 
在 软件 开发 生命 周期 内 有 很 多 的 机 会 从 他 们 所 犯 的 错误 中 吸取 教训 ,并 能 够 从 一 个 增 
量 迭 代 到 另 一 个 增 量 迭代 的 过 程 中 改进 他 们 的 技能 。 通 过 评估 每 个 增 量 迭代 的 效率 
和 有 效 性 ,项 目 经 理 能 够 为 团队 成 员 发 现 培训 的 机 会 。 相 反 . 工 作 在 瀑布 模型 中 的 团 
队 成 员 被 限制 在 狭窄 的 技术 专长 上 ,例如 仅仅 从 事 设计 、 编 码 或 者 测试 中 某 一 方面 的 
玉 作 > 

(9) 不 断 改进 开发 过 程 。 增 量 迭 代 模 型 的 后 续 评 估 不 仅 能 够 从 产品 或 者 计划 方面 揭 
示 项 目的 状态 ,也 可 以 帮助 项 目 经 理 分 析 在 下 一 个 增 量 迭代 中 如 何 改 进项 目的 组 织 结构 
和 开发 过 程 。 

常见 的 增 量 和 迭代 模型 包括 螺旋 模型 .RUP(Rational Unified Process) 和 敏捷 开发 ,下 
面 分 别 阑 述 这 三 种 增 量 和 迭代 模型 。 


1. 螺旋 模型 
螺旋 模型 由 Barry W. Boehm 于 1988 年 提出 0。 螺旋 模型 2 是 增 量 迭代 模型 的 一 种 ， 


四 “Barry W.Boehm, A spiral model of software development and enhancement , ACM SIGSOFT SOFTWARE 
ENGINEERING NOTES vol 11 no 4 ,Aug 1988. 
回 http://zh. wikipedia. org/wiki/ 螺 旋 模型 . 
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如 图 2-3 所 示 , 它 兼顾 了 快速 原型 迭代 的 特征 以 及 瀑布 模型 的 系统 化 与 严格 监控 。 螺 旋 
模型 最 大 的 特点 在 于 引入 了 其 他 模型 不 具备 的 风险 分 析 , 使 软件 在 无 法 排除 重大 风险 时 
有 机 会 停止 ,以 减 小 损失 。 在 每 个 迭代 阶段 构建 原型 是 螺旋 模型 用 来 减 小 风险 的 途径 。 
螺旋 模型 更 适合 大 型 的 系统 级 的 软件 应 用 。 


人 累计 支出 
进行 下 一 步 


ea 


评估 方案 ， 识 别 解决 风险 


决定 目标 、 方 案 和 限制 


风险 分 析 


评审 


开发 计划 | 需求 确 i 


计划 下 一 阶段 测试 计划 


图 2-3 螺旋 模型 


螺旋 模型 中 一 个 典型 的 迭代 包括 以 下 步 又。 

(1) 明确 本 次 迭代 的 目标 、 备 选 方案 以 及 应 用 备 选 方案 的 限制 。 

(2) 对 备 选 方案 进行 评估 ,明确 并 解决 存在 的 风险 ,建立 原型 。 

(3) 当 风 险 得 到 很 好 的 评估 与 解决 后 ,应 用 瀑布 模型 进行 本 次 迭代 的 开发 与 测试 。 

(4) 对 下 一 迭代 进行 计划 与 部 署 。 

(5) 项 目 利益 相关 者 对 本 次 迭代 的 交付 物 进行 评审 ,同时 检查 下 一 阶段 的 计划 。 

螺旋 模型 的 优点 是 它 在 引入 了 风险 驱动 方法 的 同时 ,兼顾 了 原型 开发 和 瀑布 模型 等 
开发 模型 的 优点 。 在 一 定 条 件 下 ,螺旋 模型 能 够 演变 成 其 他 的 开发 模型 ,例如 如 果 项 目 
获得 错误 用 户 接口 或 无 法 满足 性 能 需求 等 方面 的 风险 很 低 , 而 同时 它 在 控制 成 本 和 进度 
方面 的 风险 很 高 的 情况 ,螺旋 模型 将 会 演化 成 瀑布 模型 。 

除了 这 个 优点 以 外 ,螺旋 模型 还 具有 以 下 优点 。 

(1) 可 以 在 项 目前 期 考虑 对 已 经 存在 的 软件 进行 重用 。 

(2) 在 软件 产品 开发 过 程 中 考虑 了 软件 质量 目标 。 
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(3) 关注 于 缺陷 预防 ,并 能 够 尽早 地 发 现 缺 陷 。 

(4) 更 好 地 控制 项 目 活动 的 资源 和 相关 成 本 。 

螺旋 模型 在 很 多 领域 得 到 了 广泛 的 引用 ,但 是 螺旋 模型 也 存在 一 定 的 不 足 , 包 括 : 
(1) 过 分 依赖 风险 评估 ,一旦 在 风险 管理 过 程 中 出 现 偏差 将 造成 重大 损失 。 

(2) 过 于 灵活 的 开发 过 程 不 适合 开发 人 员 和 客户 之 间 有 明确 合同 约定 的 情况 。 
(3) 该 模型 本 身 的 文档 化 和 推广 需要 大 量 的 工作 。 


2. RUP 模型 


RUP 是 由 IBM 开发 和 维护 的 过 程 模型 。RUP 的 开发 团队 同 顾客 、 合 作 伙伴 、 
Rational 产品 小 组 及 顾问 公司 共同 协作 ,确保 开发 过 程 持续 地 更 新 和 提高 ,以 反映 新 的 经 
验 和 不 断 演化 的 实践 经 验 了 ?。RUP 的 整体 架构 如 图 2-4 所 示 。 

| 阶 自 


ek 初始 精 化 构建 产品 化 
工作 流程 | ! | ! ! ! 
1 1 


里 程 碑 J 
| 


精 化 2 ”构建 1 构建 2 构建 N 产品 化 1 产品 化 2 


过 代 


图 2-4 RUP 模型 
RUP 的 整个 开发 过 程 可 以 用 二 维 结构 来 表达 。 
(1) 横 轴 代表 了 制订 开发 过 程 的 时 间 ,体现 了 过 程 的 动态 结构 。 
(2) 纵 轴 表 现 了 9 个 核心 工作 流程 ,代表 了 所 有 角色 和 活动 的 逻辑 分 组 情况 。 
RUP 将 软件 开发 生命 周期 划分 为 4 个 连续 的 阶段 ,分 别 介绍 如 下 。 


@ 更 详细 的 关于 RUP 的 资料 可 以 查阅 IBM 的 官方 网 站 http://www. ibm. com/developerworks/cn/rational/. 
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(1) 初始 阶段 (Inception) : 初始 阶段 的 目标 是 为 系统 建立 商业 案例 和 确定 项 目的 边 
界 。 为 了 达到 该 目标 ,必须 识别 所 有 与 系统 交互 的 外 部 实体 ,在 较 高 层次 上 定义 交互 的 
特性 。 它 包括 识别 所 有 用 例 和 描述 一 些 重要 的 用 例 。 商 业 案 例 包括 验收 规范 、 风 险 评 
估 、 所 需 资源 估计 、 体 现 主要 里 程 碑 日 期 的 阶段 计划 等 。 

(2) 精 化 阶段 (Elaboration) : 精 化 阶段 的 目标 是 分 析 问 题 领域 .建立 健全 的 体系 结 
构 基础 .编制 项 目 计划 、 淘 汰 项 目 中 最 高 风险 的 元 素 。 体 系 结构 的 决策 必须 在 理解 整个 
系统 的 基础 上 做 出 ,包括 理解 系统 的 范围 .主要 功能 和 非 功能 需求 等 。 

(3) 构建 阶段 (Construction) : 在 构建 阶段 ,所 有 涉及 的 构件 和 应 用 程序 功能 被 开发 
并 集成 为 产品 ,并 详尽 测试 所 有 的 功能 。 构 建 阶段 ,从 某 种 意义 上 说 ,重点 在 管理 资源 和 
控制 运作 以 优化 成 本 、 进 度 和 质量 。 

(4) 产品 化 阶段 (Transition): 产品 化 阶段 的 目标 是 将 软件 产品 交付 给 用 户 群 体 。 
当 产 品 成 熟 得 足够 发 布 到 最 终 用 户 时 ,就 进入 了 产品 化 阶段 。 产 品 发 布 给 最 终 用 户 后 ， 
用 户 现 场 可 能 会 反馈 各 种 各 样 的 问题 ,因此 ,需要 纠正 用 户 使 用 产品 过 程 中 出 现 的 问题 
或 开发 新 版 本 等 。 

RUP 描述 了 如 何 为 软件 开发 团队 有 效 地 部 署 经 过 商业 化 验证 的 软件 开发 方法 , 即 
最 佳 实践 。 它 们 被 称 为 最 佳 实践 ,不 仅仅 是 因为 可 以 精确 地 量化 它们 的 价值 ,而 且 它 
们 也 被 许多 成 功 的 机 构 普 遍 运 用 。 这 些 最 佳 实践 是 迭代 的 开发 软件 .需求 管理 ,使 用 
基于 构件 的 体系 结构 、 可 视 化 软件 建 模 、 验 证 软件 质量 和 控制 软件 变更 。 同 时 为 使 整 
个 团队 有 效 利用 最 佳 实践 ,RUP 还 为 每 个 团队 成 员 提 供 了 必要 的 准则 、 模 板 和 工具 
指导 。 


3. 敏捷 开发 


2001 年 初 ,由 于 看 到 许多 公司 的 软件 团队 陷入 了 不 断 延 长 的 软件 开发 过 程 的 泥潭 ， 
一 批 业界 专家 聚集 在 一 起 ,概括 出 了 一 些 可 以 让 软件 开发 团队 具有 快速 工作 、 响 应 变化 
能 力 的 价值 观 (Value) 和 原则 (Principle) 。 他 们 称 自 己 为 敏捷 (Agile) 联 盟 。 在 随后 的 几 
个 月 中 ,他 们 创建 出 了 一 份 价 值 观 声明 ,也 就 是 敏捷 联盟 宣言 (The Manifesto of the 
Agile Alliance)®. 

(1) 个 体 和 交互 胜 过 过 程 和 工具 ; 

(2) 可 以 工作 的 软件 胜 过 面面俱到 的 文档 ; 

(3) 客户 合作 胜 过 合同 谈判 ; 

(4) 响应 变化 胜 过 遵循 计划 。 

业界 流行 的 敏捷 开发 方法 多 种 多 样 , 因 此 需要 根据 项 目的 大 小 和 性 质 选 择 合适 的 敏 
捷 开 发 方法 ,例如 极限 编程 XP(eXtreme Programming) ,看 板 (Kanban)、Scrum( 如 图 2-5 
所 示 ) ,功能 驱动 开发 FDD(Feature-Driven Development) 以 及 动态 系统 开发 方法 DSDM 


四 ROBERT C. MARTIN( 邓 辉 译 ) ,敏捷 软件 开发 : 原则 ,模式 与 实践 ,清华 大 学 出 版 社 ,2003. 
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(Dynamic Systems Development Methodology) 等 。 但 是 ,敏捷 开发 也 不 是 一 成 不 变 放 之 
四 海 皆 准 的 准则 ,而 是 一 个 方法 的 最 佳 实践 。 各 个 团体 和 组 织 也 需要 不 断定 制 自己 的 最 
佳 实践 。 

Daily Scrum 

一 般 持 续 15 分 钟 ， 每 个 团队 成 员 


简要 回答 如 下 三 个 问题 : 
(1) 从 上 次 Daily Scrum @ 


© 到 现在 做 了 些 什么 ? 名 / 夺 \。 
作 (2) 有 什么 阻碍 了 我 的 
工作 ? 
Sprint Backlog 2 (3) 到 下 次 的 Daily Scrum 要 做 哪些 工作 ? 
在 Sprint Backlog Scrum 


内 包含 了 为 下 一 
个 Sprint 准 备 的 
所 有 功能 特性 况 下 开发 Sprint 
Backlog 内 的 了 Sprint-Review 
在 Sprints 结 束 后 团 
三 > 队 向 Product Owner 
介绍 新 的 功能 
Ee) Sprint 计 划 
Product Backlog 产 品 Sprint- 回 顾 会 议 
Owner | 后 了 所 有 我 们 学 到 了 什么 ? 
知 的 系统 需求 哪些 地 方 还 可 以 改善 ? 


图 2-5 Scrum 


2.1.4 生命 周期 模型 中 的 测试 


之 前 介绍 了 一 些 常见 的 软件 开发 模型 ,项 目 团队 可 以 根据 实际 情况 对 模型 进行 裁 
剪 ,以 符合 实际 的 需要 。 例 如 ,对 于 V 模型 ,有 些 企业 可 能 合并 了 系统 测试 与 验收 测试 ， 
也 有 些 企业 可 能 将 集成 测试 细 分 成 前 期 集成 测试 和 后 期 集成 测试 等 。 测 试 人 员 应 及 早 
参与 开发 团队 的 评审 ,以 更 好 地 了 解 被 测 对 象 的 工作 原理 、 范 围 和 所 采用 的 技术 ,从 而 提 
升 测试 效率 和 有 效 性 。 

对 于 测试 而 言 ,在 任何 开发 模型 中 ,一 个 好 的 测试 都 应 该 具有 以 下 几 个 特点 。 

(1) 每 个 开发 活动 都 有 相对 应 的 测试 活动 。 

(2) 每 个 测试 级 别 都 有 其 特有 的 测试 目标 。 

(3) 对 于 每 个 测试 级 别 , 都 需要 在 相应 的 开发 活动 过 程 中 进行 相应 的 测试 分 析 和 
设计 。 

(4) 在 开发 生命 周期 中 .测试 人 员 在 文档 初稿 阶段 就 应 该 参与 文档 的 评审 。 
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@.2 测试 级 别 


不 同 的 软件 开发 模型 ,采用 的 测试 级 别 各 有 不 同 。 但 是 典型 的 V 模型 (如 图 2-2 所 
示 ) 中 涉及 的 4 种 测试 级 别 , 具 有 很 强 的 代表 性 ,所 以 这 里 以 V 模型 中 的 测试 级 别 为 例 ， 
对 各 个 测试 级 别 进行 阐述 。 典 型 的 V 模型 有 4 个 测试 级 别 , 即 组 件 测试 .集成 测试 .系统 
测试 和 验收 测试 ,分 别 与 开发 阶段 相对 应 。 

实际 采用 的 V 模型 测试 级 别 数目 既 可 能 比 典型 V 模型 提 到 的 4 种 多 ,也 可 能 少 ,这 
取决 于 不 同 组 织 、 项 目 和 软件 产品 的 特性 ,例如 有 的 项 目 在 组 件 测试 之 后 ,可 能 有 集成 测 
试 ; 在 系统 测试 之 后 ,可 能 有 系统 集成 测试 。 


2.2.1 组 件 测试 


1. 基本 含义 


根据 开发 人 员 使 用 的 编程 语言 的 不 同 ,软件 组 件 所 指 的 内 容 也 不 尽 相同 ,可 以 是 模 
块 .单元 ,程序 或 功能 。 在 面向 对 象 编程 中 ,它们 称 为 类 。 通 常情 况 下 ,它们 被 称 为 软件 
组 件 或 组 件 。 所 以 针对 单个 软件 组 件 的 测试 称 为 组 件 测试 。 

组 件 测试 的 目的 是 为 了 验证 软件 组 件 是 否 按 照 组 件 详细 设计 说 明 的 要 求 工作 ,发 现 
需求 和 设计 中 存在 的 错误 以 及 编码 过 程 中 引入 的 错误 。 组 件 测试 应 对 组 件 内 所 有 重要 
的 控制 路 径 设计 测试 用 例 ,以 便 发 现 组 件 内 部 的 错误 。 组 件 测试 既 可 以 采用 白 盒 测试 技 
术 ,也 会 采用 黑 盒 测试 技术 。 系 统 内 多 个 组 件 可 以 并 行 地 进行 测试 。 在 组 件 测试 过 程 
中 ,由 于 很 多 组 件 无 法 独立 的 运行 ,这 时 需要 一 些 辅助 的 组 件 与 被 测 组 件 一 起 形成 一 个 
可 运行 的 系统 ,这 些 辅助 的 组 件 称 为 桩 .驱动 器 等 。 

组 件 测试 包括 功能 测试 和 特定 的 非 功能 测试 ,例如 资源 行为 测试 (如 内 存 泄漏 ?或 健 
壮 性 测试 。 组 件 测试 的 设计 输入 主要 有 组 件 说 明 软件 详细 设计 说 明 或 代码 等 。 

通常 ,通过 开发 环境 的 支持 ,例如 组 件 测试 框架 或 调试 工具 ,组 件 测试 会 深入 到 代码 
中 ,设计 代码 的 开发 人 员 往 往 也 会 参与 测试 。 在 这 种 情况 下 ,一 旦 发 现 缺 陷 ,就 可 立即 修 
改 , 不 一 定 需要 以 正式 的 方式 记录 缺陷 。 

组 件 测试 的 一 个 方法 是 在 写 代 码 之 前 就 准备 开发 测试 用 例 , 称 为 测试 驱动 的 方法 或 
测试 驱动 开发 (Test Driven Development,TDD) 。 这 个 方法 根据 测试 用 例 的 开发 周期 进 
行 高 度 和 迭代 ,不 断 地 构建 和 集成 小 块 的 代码 ,然后 执行 组 件 测试 直到 它们 全 部 通过 为 止 。 

组 件 测试 任务 包括 组 件 局 部 数据 结构 测试 .组 件 边界 值 测试 .组 件 中 独立 执行 路 径 
测试 ,以 及 组 件 的 错误 处 理 测试 等 方面 。 
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2. 测试 环境 


当 完 成 代码 编写 并 通过 编译 检查 和 评审 , 便 可 开始 组 件 测试 。 作 为 级 别 最 低 的 测 
试 ,组 件 测试 处 理 * 直 接 来 自 开 发 人 员 桌 面 的 测试 对 象 。 很 明显 ,对 于 这 个 测试 级 别 , 测 
试 是 在 与 开发 紧密 合作 的 情况 下 进行 的 ,通常 由 开发 人 员 执行 组 件 测试 。 

被 测试 组 件 可 能 无 法 形成 一 个 完整 的 可 测试 系统 ,因此 在 组 件 测试 中 需要 为 测试 组 
件 开发 驱动 器 和 桩 模块 。 驱 动 器 用 来 生成 测试 数据 并 将 这 些 数据 传递 到 被 测试 组 件 ,而 
桩 模块 用 来 模拟 被 测试 组 件 调用 的 模块 。 它 们 的 定义 如 下 。 

(1) 驱动 器 模块 : 用 于 模拟 被 测 组 件 的 上 级 模块 , 它 生成 测试 数据 ,把 相关 的 数据 传 
送 给 被 测 组 件 ,启动 被 测 组 件 , 从 被 测 组 件 获得 反馈 信息 并 输出 相应 的 结果 。 

(2) 桩 模块 : 用 于 模拟 被 测 组 件 工作 过 程 中 所 调用 的 模块 ,它们 一 般 只 进行 很 少 的 
数据 处 理 , 例 如 打印 返回 信息 。 

了 驱动 器 和 桩 模块 是 组 件 测试 时 使 用 的 软件 ,而 不 是 软件 产品 的 组 成 部 分 ,但 它 需 要 
一 定 的 开发 成 本 。 


3. 测试 目的 


通过 组 件 测试 可 以 发 现 各 种 典型 的 软件 缺陷 ,例如 计算 错误 、 需 求 或 功能 遗漏 或 程 
序 路 径 选 择 错误 。 组 件 测试 中 需要 考虑 多 个 方面 的 测试 内 容 。 

第 一 ,检查 组 件 的 接口 参数 ,这 是 组 件 测试 的 基础 。 只 有 在 数据 能 正确 流入 ` 流 出 组 
件 的 前 提 下 ,其 他 测试 才 有 意义 。 检 查 组 件 接口 参数 正确 与 否 需 要 考虑 各 种 因素 ,例如 : 

(1) 输入 的 实际 参数 与 形式 参数 的 个 数 是 否 相同 。 

(2) 输入 的 实际 参数 与 形式 参数 的 属性 是 否 匹 配 。 

(3) 调用 其 他 组 件 时 所 给 实际 参数 的 个 数 是 否 与 被 调 组 件 的 形 参 个 数 相同 。 

(4) 调用 其 他 组 件 时 所 给 实际 参数 的 属性 是 否 与 被 调 组 件 的 形 参 属性 匹配 。 

(5) 调用 预定 义 函 数 时 所 用 参数 的 个 数 、 属 性 和 次 序 是 否 正确 。 

(6) 是 否 存在 与 当前 和 人口 点 无 关 的 参数 引用 。 

(7) 是 否 修 改 了 只 读 型 参数 。 

(8) 各 组 件 对 全 程 变 量 的 定义 是 否 一 致 。 

如 果 组 件 包括 输入 输出 ,还 应 该 考虑 以 下 因素 : 

(1) 文件 属性 是 否 正确 。 

(2) OPEN/CLOSE 语句 是 否 正确 。 

(3) 格式 说 明 与 输入 输出 语句 是 否 匹 配 。 

(4) 缓冲 区 大 小 与 记录 长 度 是 否 匹 配 。 

(5) 文件 使 用 前 是 否 已 经 打开 。 

(6) 是 否 处 理 了 文件 尾 。 

(7) 是 否 处 理 了 输入 /输出 错误 。 
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(8) 输出 信息 中 是 否 有 文字 性 错误 。 

第 二 ,检查 局 部 数据 结构 ,可 以 用 来 保证 临时 存储 在 组 件 内 的 数据 在 程序 执行 过 程 
中 的 完整 性 和 正确 性 。 局 部 数据 结构 往往 是 错误 的 根源 ,应 仔细 设计 测试 用 例 ,力求 发 
现 以 下 几 类 错误 : 

(1) 不 合适 或 不 相 容 的 类 型 说 明 。 

(2) 变量 无 初 值 。 

(3) 变量 初始 化 有 错 或 缺 省 值 有 错 。 

(4) 不 正确 的 变量 名 ( 拼 错 或 不 正确 的 截断 ) 。 

(5) 出 现 上 洲 、 下 洲 和 地 址 异常 。 

第 三 ,在 组 件 中 应 对 每 一 条 独立 执行 路 径 进行 测试 ,组 件 测试 的 基本 任务 是 保证 组 
件 中 每 条 语句 至 少 执行 一 次 。 此 时 设计 测试 用 例 是 为 了 发 现 因 错误 计算 .不 正确 的 比较 
和 不 适当 的 控制 流 造成 的 错误 。 例 如 : 

(1) 误解 或 用 错 了 运算 符 优先 级 。 

(2) 混合 类 型 运算 。 

(3) 错误 的 变量 初 值 。 

(4) 数据 精度 不 够 。 

(5) 错误 的 表达 式 符号 。 

第 四 ,组 件 测试 通常 与 控制 流 相关 ,测试 用 例 还 应 致力 于 发 现 以 下 错误 : 

(1) 不 同 数据 类 型 的 对 象 之 间 进 行 比较 。 

(2) 错误 地 使 用 逻辑 运算 符 或 优先 级 。 

(3) 因 计 算 机 表示 的 局 限 性 ,期 望 理论 上 相等 而 实际 上 不 相等 的 错误 。 

(4) 比较 运算 或 变量 出 错 。 

(5) 不 可 能 出 现 的 循环 终止 条 件 ( 死 循环 )。 

(6) 错误 地 修改 了 循环 变量 。 

第 五 ,好 的 设计 应 能 预见 各 种 出 错 条 件 , 并 预 设 各 种 出 错 处 理 , 出 错 处 理 同样 需要 认 
真 测试 ,测试 应 着 重 检查 以 下 问题 : 

(1) 输出 的 出 错 信息 是 否 难 以 理解 。 

(2) 记录 的 错误 与 实际 遇 到 的 错误 是 否 相 符 。 

(3) 异常 处 理 不 当 。 

(4) 错误 陈述 中 未 能 提供 足够 的 出 错 定位 信息 。 

另外 ,边界 值 测试 是 组 件 测试 中 常 采用 的 一 种 测试 。 众 所 周知 ,软件 经 常 在 边界 上 
失效 ,采用 边界 值 分 析 测 试 技术 设计 测试 用 例 .很 有 可 能 发 现 新 的 错误 。 

同时 ,组 件 测试 中 也 需要 关注 软件 的 可 维护 性 。 可 维护 性 主要 指 程序 代码 中 所 有 特 
性 是 否 对 修改 系统 的 难 易 程度 或 继续 开发 有 影响 。 这 时 开发 人 员 对 程序 和 其 上 下 文 的 
理解 至 关 重要 。 这 里 既 包括 几 个 月 或 几 年 后 又 被 要 求 继续 开发 的 程序 的 原 开发 人 员 ,也 
包括 负责 更 新 别人 开发 的 代码 的 其 他 程序 员 。 因 而 代码 结构 、 模 块 化 .代码 注释 的 质量 、 
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标准 符合 性 、 可 理解 性 ,文档 化 等 对 可 维护 性 测试 是 非常 重要 的 。 


2.2.2 集成 测试 


完成 组 件 测试 之 后 ,不 同 组 件 需要 集成 在 一 起 ,形成 更 大 的 子 系统 。 此 时 ,需要 对 被 
集成 的 不 同 组 件 之 间 的 交互 进行 测试 ,以 确保 它们 之 间 是 可 以 正常 工作 的 。 这 就 需要 进 
行 针 对 组 件 的 集成 测试 。 


1. 基本 含义 


集成 测试 是 一 种 旨 在 暴露 接口 以 及 集成 组 件 /系统 间 交 互 时 存在 的 缺陷 的 测试 。 集 
成 测试 根据 集成 的 对 象 可 分 为 组 件 集成 测试 和 系统 集成 测试 (综合 系统 )。 在 ISTQB 基 
础 级 ,主要 讨论 组 件 集成 测试 。 组 件 集成 测试 是 组 件 测试 的 逻辑 扩展 ,主要 是 对 集成 的 
组 件 之 间 的 接口 和 组 件 与 组 件 的 协同 工作 进行 测试 。 集 成 测试 的 主要 测试 依据 有 软件 
和 系统 技术 设计 文档 .系统 架构 .定义 和 描述 接口 的 文档 .工作 流 、. 用 例 等 。 

组 件 集成 测试 的 最 简单 的 形式 是 将 多 个 已 经 测试 通过 的 组 件 组 合成 一 个 新 的 更 大 
的 组 件 ( 子 系统 ) ,并 且 测试 集成 组 件 之 间 的 接口 (数据 交换 )。 组 件 集成 测试 的 主要 工作 
是 把 在 组 件 测试 过 程 中 已 经 成 功 通过 测试 的 各 组 件 逐 步 集 成 在 一 起 ,检查 数据 是 否 能 够 
在 各 组 件 之 间 正 确 传递 和 调用 ,以 及 各 组 件 能 否 正 确 地 协同 工作 。 

集成 测试 可 以 应 用 在 多 种 级 别 , 也 可 以 根据 不 同 的 测试 对 象 规模 采用 不 同 的 集成 测 
试 级 别 , 例 如 以 下 两 种 。 

(1) 组 件 集成 测试 : 对 不 同 的 软件 组 件 之 间 的 接口 和 相互 作用 进行 测试 ,一 般 在 组 
件 测试 之 后 进行 。 

(2) 系统 集成 测试 : 对 不 同系 统 之 间 的 相互 协同 作用 和 接口 进行 测试 ,一 般 在 系统 
测试 结束 之 后 进行 。 在 这 种 情况 下 ,开发 组 织 /团体 只 能 控制 自己 开发 的 这 部 分 接口 ,所 
以 变更 可 能 是 不 稳定 的 。 按 照 工作 流 执行 的 业务 操作 可 能 包含 了 多 个 系统 ,因此 跨 平 台 
的 问题 对 于 系统 集成 测试 至 关 重 要 。 

集成 范围 越 大 ,定位 缺陷 就 越 困 难 , 从 而 系统 的 风险 就 越 大 。 集 成 的 策略 可 以 根据 
系统 的 框架 (例如 自 顶 向 下 或 自 底 向 上 )、 功 能 任务 集 或 处 理 过程 顺 序 等 来 制定 。 为 了 减 
少 在 生命 周期 后 期 发 现 缺陷 而 产生 的 风险 ,集成 程度 应 该 逐步 增加 ,而 不 是 一 下 子 将 组 
件 或 系统 集成 为 “ 巨 无 霸 ” 进 行 测试 。 测 试 特定 的 非 功能 特性 (例如 性 能 测试 ) 也 可 以 包 
含 在 集成 测试 中 。 

在 集成 测试 的 每 个 阶段 ,测试 人 员 应 该 把 精力 集中 在 集成 本 身 。 举 例 来 说 ,假如 系 
统 是 由 组 件 A 和 组 件 也 组 成 的 , 则 集成 测试 感 兴趣 的 是 两 个 组 件 之 间 的 接口 ,而 不 是 每 
个 组 件 的 功能 。 黑 盒 测试 技术 和 白 盒 测试 技术 都 可 以 应 用 在 集成 测试 中 。 

理想 情况 下 ,测试 人 员 需 要 理解 系统 的 架构 ,从 而 可 以 对 集成 测试 计划 施加 影响 。 
假如 集成 测试 计划 是 在 组 件 或 系统 生成 之 前 制定 的 , 则 可 以 根据 最 有 效率 的 测试 顺序 来 
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进行 集成 测试 。 
2. 测试 对 象 


组 件 集成 测试 是 在 组 件 测试 的 基础 上 ,将 经 过 组 件 测试 的 软件 组 件 按照 系统 技术 设 
计 的 要 求 组 装 成 子 系统 ,并 检验 各 部 分 工作 是 否 达到 或 实现 相应 技术 指标 及 要 求 的 过 程 
和 活动 。 也 就 是 说 ,在 集成 测试 之 前 ,集成 的 组 件 应 该 已 经 通过 组 件 测试 ,否则 集成 测试 
的 效果 将 会 受到 很 大 影响 ,并 且 在 集成 测试 过 程 中 去 发 现 和 定位 组 件 的 缺陷 ,并 修改 这 
些 缺 陷 的 成 本 将 是 非常 高 昂 的。 其 典型 的 测试 对 象 包括 组 件 集成 后 的 子 系统 的 功能 性 ， 
即 检查 组 件 与 组 件 是 否 能 协同 工作 ,以 及 子 系统 内 组 件 与 组 件 间 的 接口 , 子 系统 与 外 界 
的 接口 等 。 

在 现实 方案 中 ,集成 是 指 多 个 组 件 的 组 合 .许多 组 件 组 合成 子 系统 ,而 这 些 子 系统 又 
聚合 成 程序 的 更 大 部 分 ,如 子 系统 或 系统 。 集 成 测试 的 主要 测试 依据 是 软件 的 系统 设计 
技术 .接口 的 描述 或 定义 ,任何 不 符合 该 说 明 的 行为 都 应 该 作为 缺陷 上 报 。 


3. 测试 目的 


集成 测试 需要 同时 覆盖 功能 特性 和 非 功 能 特性 ,具体 的 非 功 能 特性 应 该 根据 软件 需 
求 和 设计 的 要 求 而 定 。 测 试 的 目的 是 确认 各 软件 组 件 集成 后 形成 的 子 系统 能 否 达 到 系 
统 设计 技术 中 各 组 件 间 协 同 工 作 的 设计 目标 。 集 成 测试 包括 如 下 具体 的 测试 内 容 。 

(1) 集成 的 子 系统 的 功能 测试 , 即 检查 集成 的 子 系统 能 否 满足 设计 所 要 求 的 功能 特 
性 和 指标 。 

(2) 检查 一 个 软件 组 件 的 功能 是 否 会 对 另 一 个 软件 组 件 的 功能 产生 不 利 影响 。 

(3) 根据 计算 精度 的 要 求 , 多 个 软件 组 件 的 误差 积累 起 来 ,是 否 仍 能 够 达到 设计 要 求 
的 技术 指标 。 

(4) 软件 组 件 之 间 的 接口 测试 , 即 集成 的 子 系统 内 各 软件 组 件 之 间 ,数据 在 通过 其 接 
口 时 是 否 会 出 现 不 一 致 情况 ,例如 是 否 会 出 现 数据 丢失 。 

(5) 全 局 数据 结构 的 测试 , 即 检查 各 个 软件 组 件 所 用 到 的 全 局 变量 是 否 一 臻 合理。 

(6) 对 程序 中 可 能 有 的 特殊 安全 性 要 求 进行 测试 。 

(7) 根据 软件 需求 和 设计 中 提出 的 非 功能 特性 的 要 求 进行 非 功能 性 测试 。 

集成 测试 的 测试 对 象 主要 关注 被 集成 组 件 之 间 的 接口 以 及 各 组 件 的 协同 工作 ,例如 
数据 交换 或 组 件 之 间 的 通信 。 因 此 通过 静态 测试 发 现 缺 陷 很 困难 ,更 适合 通过 动态 测试 
发 现 这 些 缺 陷 。 集 成 测试 中 发 现 的 缺陷 大 概 可 以 分 为 以 下 几 类 。 

(1) 组 件 传送 了 错误 的 数据 ,或 没有 传送 数据 ,导致 接收 数据 的 组 件 不 能 操作 或 崩溃 
(组 件 的 功能 缺陷 、 接 口 格式 不 兼容 .协议 缺陷 等 ) 。 

(2) 通信 正常 ,但 是 被 调用 的 组 件 使 用 不 同 的 方法 来 解析 接收 到 的 数据 (组 件 的 功能 
缺陷 、 规 格 说 明 矛 盾 或 错误 的 理解 ) 。 

(3) 数据 内 容 传输 正确 ,但 是 传输 的 时 间 错 误 或 传输 的 延迟 (时 序 问 题 ) ,或 者 传输 的 
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时 间 间 隔 太 短 ( 吞 吐 量 、 负 荷 、 容 量 问题 ) 。 
4. 集成 策略 


为 了 更 有 效 地 对 不 同 组 件 进行 集成 ,需要 选择 合适 的 集成 策略 。 集 成 策略 主要 分 为 
两 种 : 非 渐 增 式 集成 测试 和 渐 增 式 集 成 测试 ,具体 包括 自 底 向 上 集成 、 自 顶 向 下 集成 、 核 
心 系统 先行 集成 以 及 随意 集成 测试 等 。 实 际 运 用 中 需要 根据 具体 被 测 对 象 的 逻辑 层次 
特性 和 物理 分 布 特性 综合 考虑 选择 哪 种 集成 模式 进行 测试 。 以 下 是 几 种 常用 的 集成 
策略 。 

1) 自 底 向 上 集成 测试 

自 底 向 上 的 集成 (Bottom-Up Integration) 方 式 是 最 常 使 用 的 策略 之 一 ,其 他 集成 方 
法 都 或 多 或 少 地 继承 、 吸 收 了 这 种 集成 策略 的 思想 。 自 底 向 上 集成 策略 从 组 件 结 构 中 最 
底层 的 组 件 开始 集 成 和 测试 。 因 为 组 件 是 自 底 向 上 进行 集成 的 ,对 于 一 个 给 定 层次 的 组 
件 , 它 的 下 层 的 组 件 称 为 子 组 件 , 子 组 件 ( 包 括 子 组 件 的 所 有 下 属 组 件 ) 事 先 已 经 完成 集 
成 并 经 过 测试 ,所 以 不 再 需要 特地 开发 相应 的 桩 模块 。 自 底 向 上 集成 测试 的 步骤 大 致 
如 下 。 

步骤 1: 按照 系统 技术 设计 ,明确 有 哪些 被 测 组 件 。 在 熟悉 被 测 组 件 特征 的 基础 上 
对 被 测 组 件 进 行 分 层 , 在 同一 层次 上 的 组 件 , 可 以 并 行进 行 测试 ,然后 排出 测试 活动 的 先 
后 关系 ,制定 测试 执行 进度 。 

步骤 2: 按 组 件 间 的 层次 关系 ,将 软件 组 件 集成 为 子 系统 ,并 测试 在 集成 过 程 中 出 现 
的 问题 。 这 里 ,可 能 需要 测试 人 员 开发 一 些 驱动 器 来 驱动 集成 活动 中 形成 的 被 测 组 件 。 

步骤 3: 持续 将 上 层 软件 组 件 集成 到 子 系统 中 ,直到 集成 为 完整 的 系统 。 

自 底 向 上 的 集成 测试 方案 是 软件 工程 实践 中 最 常用 的 测试 方法 ,相关 技术 也 较为 成 
熟 , 它 的 主要 特点 如 下 。 

(1) 优点 : 因为 是 从 最 底层 开始 往 上 集成 ,所 以 不 再 需要 模拟 下 层 的 桩 模块 ; 一 个 系 
统 中 的 底层 组 件 往 往 是 比较 敏感 或 关键 的 组 件 , 自 底 向 上 的 集成 自然 优先 集成 了 这 些 敏 
感 和 关键 的 组 件 。 

(2) 缺点 : 测试 时 要 用 到 驱动 器 模块 模拟 上 层 组 件 ; 测试 时 测试 员 只 能 通过 驱动 器 
模块 而 不 是 通过 用 户 界面 操作 集成 的 子 系统 ,所 以 测试 会 变 得 复杂 烦琐 。 

2) 自 顶 向 下 集成 测试 

自 顶 向 下 集成 是 构造 程序 结构 的 一 种 增 量 式 方式 , 它 从 最 上 层 的 主 控 组 件 ( 往 往 是 
友好 方便 的 图 形 用 户 界 面 GUD 开 始 ,按照 软件 的 控制 层次 结构 ,逐步 把 各 个 组 件 集成 在 
一 起 。 深 度 优先 策略 首先 把 主 控制 路 径 上 的 组 件 集成 在 一 起 。 自 顶 向 下 集成 测试 的 具 
体 步 骤 如 下 。 

步骤 1: 以 主 控 组 件 作为 测试 驱动 器 ,把 对 主 控 组 件 进 行 组 件 测 试 时 引入 的 桩 用 实 
际 组 件 替代 。 

步骤 2: 依据 所 选 的 集成 策略 (深度 优先 或 广度 优先 ) ,每 次 只 替代 一 个 桩 。 
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步骤 3: 每 集成 一 个 新 组 件 立即 测试 一 遍 。 

步骤 4: 只 有 每 组 测试 完成 后 , 才 着 手 蔡 换 下 一 个 桩 。 

步骤 5: 为 避免 引入 新 错误 ,必须 不 断 地 进行 回归 测试 ( 即 全 部 或 部 分 地 重复 已 做 过 
的 测试 ) 。 

从 步骤 2 开始 ,循环 执行 上 述 步骤 ,直至 整个 程序 结构 集成 完毕 。 

自 顶 向 下 集成 的 优 缺点 如 下 。 

(1) 优点 : 能 尽早 地 对 程序 的 主要 控制 路 径 和 决策 机 制 进行 检验 ,因此 能 够 较 早 地 
发 现 错误 ; 不 需要 特地 开发 上 层 的 驱动 器 模块 ,或 者 只 需要 简单 的 测试 驱动 ,这 是 因为 经 
过 测试 的 较 高 级 别 组 件 组 成 了 测试 环境 的 主要 部 分 ; 由 于 是 从 最 上 层 的 组 件 开 始 集成 ， 
可 以 直接 从 (图 形 ) 用 户 界面 操作 子 系统 ,使 测试 变 得 简便 。 

(2) 缺点 : 在 测试 高 层 组 件 时 ,需要 模拟 低层 的 桩 模块 ,不 能 反映 真实 情况 ,重要 数 
据 不 能 及 时 回 送 到 上 层 组 件 , 因 此 测试 并 不 充分 ; 桩 的 成 本 很 高 ; 底层 的 敏感 和 关键 组 
件 不 能 优先 集成 和 测试 。 

3) 核心 系统 先行 集成 测试 

核心 系统 先行 集成 测试 策略 的 思想 是 先 对 核心 组 件 进行 集成 测试 ,在 测试 通过 的 基 
础 上 再 按 其 他 组 件 的 重要 程度 逐个 集成 到 核心 系统 中 。 每 次 加 入 一 个 组 件 ,直至 最 后 形 
成 稳定 的 软件 产品 。 核 心 系统 先行 集成 测试 策略 对 应 的 集成 过 程 是 一 个 逐渐 趋 于 闭合 
的 螺旋 形 曲线 ,代表 产品 逐步 定型 的 过 程 , 其 步骤 如 下 。 

步骤 1: 对 核心 系统 中 的 组 件 进行 单独 而 充分 的 测试 ,必要 时 使 用 驱动 器 和 桩 模块 。 

步骤 2: 将 核心 系统 中 的 组 件 一 次 性 集合 到 被 测 系统 中 ,解决 集成 中 出 现 的 各 类 问 
题 。 在 核心 系统 规模 相对 较 大 的 情况 下 ,也 可 以 按照 自 底 向 上 或 自 顶 向 下 的 步 又 ,集成 
核心 系统 的 各 组 成 组 件 。 

步骤 3: 按照 其 他 组 件 的 重要 程度 以 及 组 件 间 的 相互 制约 关系 ,拟定 其 他 软件 组 件 
集成 到 核心 系统 中 的 顺序 方案 。 方 案 经 评审 以 后 , 即 可 进行 其 他 组 件 的 集成 。 

步骤 4: 在 其 他 软件 组 件 添 加 到 核心 系统 以 前 ,首先 应 该 确保 它们 都 已 完成 组 件 
测试 。 

步 又 5: 按 顺 序 不 断 加 入 其 他 软件 组 件 ,修复 集成 过 程 中 发 现 的 缺陷 ,形成 最 终 的 用 
户 系统 。 

该 集成 策略 对 于 快速 软件 开发 很 有 效果 ,适合 较 复杂 系统 的 集成 测试 ,能 优先 保证 
一 些 重要 功能 的 实现 。 其 缺点 是 采用 此 策略 的 系统 一 般 应 能 明确 区 分 核心 软件 组 件 , 核 
心软 件 组 件 应 具有 较 高 的 耦合 度 ,而 其 他 软件 组 件 内 部 应 具有 较 高 的 内 聚 度 , 但 应 具有 
较 低 的 耦合 度 。 

4) 按照 组 件 完成 时 间 进 行 集成 测试 

按照 组 件 完成 的 顺序 进行 集成 。 

(1) 优点 : 节省 时 间 , 因 为 每 个 组 件 可 以 最 快 地 集成 到 系统 中 。 

(2) 缺点 : 桩 和 测试 驱动 器 都 需要 。 
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以 上 介绍 了 几 种 常见 的 集成 测试 策略 。 在 实际 操作 中 ,一 个 项 目 可 能 同时 采用 多 种 
测试 策略 ,例如 主要 采用 基于 核心 系统 先行 的 集成 策略 ,但 是 在 其 中 的 一 些 子 系统 中 采 
用 自 底 向 上 的 策略 。 读 者 应 该 结合 项 目的 实际 工程 环境 及 各 测试 策略 适用 的 范围 进行 
合理 的 选 型 。 


2.2.3 系统 测试 


1. 基本 含义 


系统 测试 是 将 已 经 集成 好 的 软件 系统 ,作为 计算 机 系统 的 一 部 分 ,与 计算 机 硬件 、 其 
他 支持 软件 .数据 和 人 员 等 系统 元 素 结合 起 来 ,在 测试 环境 下 对 计算 机 系统 进行 一 系列 
严格 有 效 的 测试 。 系 统 测试 关注 的 是 项 目 或 产品 范围 中 定义 的 整个 系统 或 产品 的 行为 。 
在 系统 测试 中 ,测试 环境 应 该 尽量 和 最 终 使 用 的 目标 或 产品 使 用 的 环境 相 一 致 ,从 而 减 
少 和 环境 相关 的 失效 。 

针对 系统 测试 开发 测试 用 例 的 方式 可 以 是 多 种 多 样 的 ,例如 基于 风险 、 根 据 需求 说 
明 根据 业务 过 程 应 用 、 基 于 用 例 或 者 用 户 场景 ,根据 操作 系统 和 系统 资源 相互 作用 等 。 

系统 测试 需要 对 系统 功能 和 非 功能 需求 进行 研究 。 系 统 需求 可 以 以 文本 形式 或 模 
型 方式 描述 ,同时 测试 人 员 也 需要 知道 在 需求 不 完全 或 需求 没有 文档 化 的 时 候 如 何 进 行 
测试 ,验证 功能 需求 的 系统 测试 可 以 选择 最 适合 的 基于 说 明 的 测试 , 即 黑 盒 测试 技术 来 
对 系统 进行 测试 ,例如 决策 表 技术 可 以 根据 描述 的 业务 准则 的 他 辑 组 合 来 生成 测试 用 
例 。 基 于 结构 的 技术 即 白 盒 测试 技术 ,可 以 用 来 评估 系统 结构 元 素 的 完整 性 等 。 系 统 测 
试 通常 由 独立 的 测试 团队 进行 。 


2. 测试 环境 


集成 测试 完成 后 ,各 个 软件 组 件 已 经 集成 为 一 个 完整 的 软件 系统 ,这 时 ,系统 测试 可 
以 将 被 测 对 象 看 成 一 个 完整 的 软件 系统 进行 测试 。 系 统 测 试 环境 应 该 在 尽 可 能 和 目标 
运行 环境 一 致 的 情况 下 进行 。 

为 尝试 节约 成 本 并 减少 工作 量 ,测试 人 员 经 常 容 易 犯 一 个 错误 : 在 客户 的 运行 环境 
上 执行 系统 测试 ,而 不 是 在 独立 的 环境 中 测试 。 这 可 能 带 来 以 下 负面 影响 : 

(1) 系统 测试 时 ,很 可 能 发 生 失效 并 对 客户 的 运行 环境 造成 破坏 。 在 用 户 环境 中 系 
统 发 生 的 系统 崩溃 和 数据 丢失 的 代价 是 巨大 的 。 

(2) 测试 人 员 难 以 ,甚至 无 法 对 运行 环境 的 参数 进行 配置 和 修改 。 

由 于 客户 环境 中 的 其 他 系统 在 测试 的 时 候 也 同时 在 运行 ,测试 环境 在 不 断 变化 ,所 
以 导致 系统 测试 的 执行 不 能 重 现 , 或 者 很 难 重 现 。 同 时 ,不 应 该 低估 系统 测试 的 工作 量 ， 
尤其 是 在 测试 环境 比较 复杂 的 情况 下 。 
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3. 测试 目的 


系统 测试 的 目的 是 确认 整个 系统 是 否 满足 了 需求 说 明 中 的 功能 和 非 功能 需求 ,以 及 
满足 的 程度 。 系 统 测试 应 该 发 现实 现 和 需求 不 一 致 而 引起 的 失效 。 常 见 的 系统 测试 需 
要 获 盖 压力 测试 .容量 测试 ,性 能 测试 安全 测试 、 容 错 测试 等 非 功能 质量 特性 。 


2.2.4 验收 测试 


1. 基本 含义 


验收 测试 的 目的 是 对 系统 功能 .系统 的 某 部 分 或 特定 的 系统 非 功 能 特性 进行 测试 。 
验收 测试 通常 由 使 用 系统 的 用 户 来 参与 或 主导 ,同时 系统 的 其 他 利益 相关 者 也 可 能 参与 
其 中 。 

发 现 缺 陷 不 是 验收 测试 的 主要 目标 ,通过 验收 测试 也 可 以 评估 系统 是 否 可 以 发 布 ， 
以 及 用 户 对 系统 使 用 的 准备 情况 等 。 验 收 测试 不 一 定 是 最 后 级 别 的 测试 ,例如 ,对 于 大 
型 的 系统 ,可 能 会 在 验收 测试 之 后 ,进行 系统 的 集成 测试 。 


2. 验收 测试 类 型 


验收 测试 也 可 以 在 较 低 的 测试 级 别 执行 ,或 者 分 布 在 多 个 测试 级 别 上 进行 。 例 如 : 

(1) 组 件 的 可 用 性 验收 测试 可 以 在 组 件 测试 中 进行 ; 

(2) 功能 增强 的 组 件 验收 测试 可 以 在 系统 测试 之 前 进行 。 

典型 的 验收 测试 有 如 下 几 种 类 型 。 

(1) 用 户 验收 测试 : 通常 由 客户 /用 户 验 证 系统 的 可 用 性 。 

(2) 操作 (验收 ?测试 : 由 系统 管理 员 进行 的 验收 测试 ,包括 : 

Q@ 系统 备份 /恢复 测试 。 

@ 灾难 性 测试 。 

@ 用 户 管理 (权限 设置 等 ) 测 试 。 

@ 维护 任务 测试 。 

@ 定期 的 安全 漏洞 检查 。 

(3) 合同 和 规范 的 验收 测试 : 合同 验收 测试 根据 合同 中 规定 的 验收 准则 ,对 软件 进 
行 测试 。 规 范 的 验收 测试 必须 根据 要 遵守 的 规范 进行 测试 ,例如 政府 ,法律 和 安全 方面 
的 规则 。 

(4) Alpha 和 Beta 测试 : 在 很 多 商业 化 软件 (Commercial Off-The-Shelf,COTS) 的 
开发 过 程 中 ,在 软件 产品 正式 进入 商业 销售 之 前 ,希望 从 市 场 中 潜在 的 或 已 经 存在 的 用 
户 中 得 到 软件 使 用 的 反馈 。Alpha 测试 通常 在 开发 组 织 内 进行 ,Beta 测试 通常 在 用 户 现 
场 进行 测试 。 通 常情 况 下 ,Alpha 测试 和 Beta 测试 都 是 由 客户 主导 进行 测试 。 

验收 测试 的 范围 很 广 , 它 取决 于 应 用 软件 的 风险 。 如 果 开 发 的 软件 是 用 户 定制 的 并 
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且 具 有 高 风险 , 则 需要 进行 全 面 的 验收 测试 。 另 外 一 个 极端 的 情况 是 获得 一 个 标准 的 产 
品 , 已 经 在 类 似 的 环境 运行 了 很 长 时 间 。 这 种 情况 下 ,验收 测试 应 包括 安装 系统 ,可 能 运 
行 一 些 有 代表 性 的 用 例 (Use Case) 。 如 果 系 统 要 通过 一 种 新 的 方式 和 其 他 系统 合作 ,至 
少 要 测试 一 下 互 操作 性 。 下 面 对 几 种 常用 的 验收 测试 进行 简单 的 描述 。 

1) 根据 合同 的 验收 测试 

如 果 是 客户 定制 的 软件 ,客户 (和 卖方 合作 ) 将 根据 合同 要 求 执行 验收 测试 。 客 户 在 
验收 测试 结果 的 基础 上 判断 订购 的 软件 系统 是 否 存在 (严重 ) 缺 陷 , 评 估 开 发 合同 或 者 是 
合同 中 定义 的 服务 是 否 已 经 满足 。 在 内 部 软件 开发 的 时 候 , 同 一 组 织 内 部 的 用 户 部 门 和 
IT 部 门 会 存在 或 多 或 少 的 正式 合同 。 

测试 标准 是 开发 合同 中 定义 的 验收 标准 ,因此 必须 清晰 明确 地 表示 这 些 标准 。 同 时 
还 必须 明确 所 有 需要 遵守 的 规章 ,例如 政府 的 法律 上 的 、 安 全 方面 的 规章 。 

实际 上 ,软件 开发 人 员 会 在 自己 进行 系统 测试 的 时 候 检查 这 些 标准 。 对 于 验收 测 
试 ,重新 执行 验收 相关 的 测试 用 例 , 就 能 够 向 客户 证 明 软 件 已 经 满足 合同 中 的 验收 标准 。 

供应 商 可 能 会 对 验收 标准 存在 误解 ,因此 由 客户 来 设计 ,或 者 至 少 参 与 评审 验收 测 
试用 例 是 至 关 重 要 的 。 与 在 测试 环境 中 进行 的 系统 测试 不 同 ,验收 测试 是 在 客户 /用 户 
的 实际 环境 中 进行 的 。 由 于 测试 环境 不 同 , 系 统 测试 中 能 够 正常 工作 的 测试 用 例 在 实际 
环境 中 可 能 会 失败 。 验 收 测试 还 需 检查 交付 和 安装 过 程 。 验 收 测试 的 环境 应 该 和 运行 
环境 一 致 ,但 是 在 实际 运行 环境 中 的 测试 用 例 本 身 应 该 避免 对 其 他 正在 运行 的 软件 系统 
造成 破坏 。 

2) 用 户 验 收 测试 

用 户 验收 测试 是 巾 最终 使 用 系统 的 用 户 来 参与 执行 的 。 通 常 不 同 的 用 户 群 对 系统 
的 期 望 有 所 不 同 。 即 便 只 有 单一 用 户 群 ,也 会 因为 系统 难以 使 用 而 拒绝 接受 该 系统 ,这 
会 给 系统 的 应 用 带 来 麻烦 。 即 使 系统 从 技术 和 功能 的 角度 看 都 很 好 ,也 可 能 会 发 生 这 种 
情况 。 因 而 需要 对 每 一 个 用 户 群 都 组 织 相 应 的 用 户 验收 测试 。 通 常 由 用 户 组 织 或 参与 
这 些 测 试 , 并 基于 业务 过 程 和 典型 的 用 户 场景 选择 测试 用 例 。 

为 了 提高 验收 测试 的 质量 ,减少 验收 测试 中 发 现 的 问题 ,建议 在 项 目的 前 期 允许 一 
些 用 户 代表 参与 评审 ,尽早 地 发 现 和 修改 存在 的 问题 。 

3) 操作 (验收 ?测试 

操作 (验收 ?测试 是 为 了 保证 系统 管理 员 对 系统 的 验收 而 进行 的 测试 。 测 试 可 以 包 
括 备份 /恢复 循环 测试 ,灾难 恢复 ,用户 管 理 、 维 护 任务 和 安全 攻击 检查 等 。 

4) 现场 测试 

如 果 软 件 会 在 许多 不 同 的 运行 环境 中 运行 ,软件 开发 人 员 在 系统 测试 时 为 每 种 应 用 
创建 测试 环境 的 开销 将 会 很 大 ,甚至 是 不 可 能 的 。 这 种 情况 下 ,系统 测试 完成 后 ,软件 开 
发 人 员 可 以 选择 执行 现场 测试 。 现 场 测试 的 目标 是 识别 完全 未 知 的 或 没有 详细 说 明 的 
用 户 环境 的 影响 ,并 在 需要 的 时 候 消除 这 些 影响 。 因 此 软件 开发 人 员 将 预 发 布 的 稳定 软 
件 版 本 交付 给 预先 选 定 的 客户 ,这 些 客户 能 够 充分 代表 软件 的 目标 市 场 , 或 者 他 们 的 运 
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行 环境 正好 可 以 覆盖 可 能 的 环境 。 

客户 既 可 以 运行 特定 的 测试 场景 ,也 可 以 在 真实 环境 中 对 产品 进行 使 用 。 他 们 将 反 
人 馈 发 现 的 问题 .意见 和 对 新 产品 的 印象 。 

现场 测试 不 能 完全 替代 系统 测试 ,因为 它们 的 测试 目的 和 测试 重点 是 不 一 样 的。 只 
有 当 系 统 测试 已 经 证 明 软件 足够 稳定 后 , 才 可 以 将 新 产品 提交 给 潜在 的 客户 /用 户 做 现 
场 测试 。 


@.3 测试 类 型 


前 面 讲解 了 典型 V 模型 的 4 个 测试 级 别 的 基本 概念 ,以 及 它们 的 测试 环境 和 测试 目 
的 。 不 同 的 测试 级 别 , 其 测试 目的 是 不 一 样 的 。 因 此 ,不 同 的 测试 级 别 . 不 同 的 测试 目 
的 ,需要 有 不 同 的 测试 类 型 。 

ISTQB 初级 大 纲要 求 测试 人 员 人 掌握 如 下 4 种 测试 类 型 。 

(1) 功能 测试 : 关注 被 测 对 象 所 实现 的 功能 ,可 以 应 用 的 软件 模型 包括 过 程 流 模型 、 
状态 转换 模型 或 简明 的 语言 规范 等 。 

(2) 非 功能 测试 : 关注 被 测 对 象 的 非 功能 属性 ,可 以 参考 的 软件 模型 包括 性 能 模型 、 
易 用 性 模型 .安全 威胁 模型 等 。 

(3) 基于 结构 的 测试 : 关注 被 测 对 象 的 结构 和 架构 信息 ,可 以 参考 的 软件 模型 包括 
控制 流 模型 菜单 结构 模型 等 。 

(4) 与 变更 相关 的 测试 : 确认 缺陷 是 否 已 经 成 功 修改 (确认 测试 ), 以 及 变更 是 否 会 
引入 新 的 缺陷 (回归 测试 )。 


2.3.1 功能 测试 


功能 测试 指 的 是 通过 对 组 件 / 系 统 功 能 说 明 的 分 析 而 进行 的 测试 , 即 功能 测试 主要 
用 来 评估 软件 产品 在 指定 条 件 下 使 用 时 ,提供 满足 明确 和 隐 含 要 求 的 功能 的 能 力 。 软 件 
功能 主要 指 的 是 系统 能 做 什么 ,通常 会 在 各 类 文档 中 描述 ,例如 需求 说 明 、 用 例 或 功能 说 
明 。 但 在 实际 的 测试 过 程 中 ,可 能 无 法 找到 针对 某 些 软件 功能 的 描述 ,甚至 根本 没有 任 
何 对 应 的 文档 。 

功能 测试 基于 被 测 对 象 的 功能 或 特征 (来 自 文档 中 的 描述 或 根据 测试 人 员 自 己 的 理 
解 ) ,测试 人 员 可 以 在 各 个 测试 级 别 对 它们 进行 测试 ,例如 组 件 测试 .系统 测试 。 根 据 被 
测 对 象 的 功能 ,测试 人 员 可 以 采用 基于 说 明 的 技术 设计 测试 用 例 。 

功能 测试 主要 考虑 的 是 软件 的 外 部 表现 行为 。 功 能 测试 通常 采用 黑 盒 测试 设计 技 
术 设 计 功 能 测试 用 例 ,包括 验证 被 测 对 象 的 各 种 输入 输出 行为 。 功 能 测试 的 主要 依据 是 
对 应 的 功能 需求 ,其 中 详细 描述 了 被 测 对 象 的 行为 , 即 必须 完成 的 功能 。 
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在 基于 需求 的 测试 中 ,对 于 每 个 需求 至 少 需 要 设计 一 个 测试 用 例 与 之 相对 应 。 功 能 
测试 除了 基于 需求 的 测试 外 ,也 包括 基于 业务 流程 的 测试 , 即 关注 由 许多 步骤 组 成 的 整 
个 业务 过 程 的 测试 ,例如 在 线 购物 系统 中 用 户 从 登录 到 成 功 结账 的 业务 过 程 。 

根据 “软件 工程 一 软件 产品 质量 (ISO/ITEC-9126)” 中 的 描述 ,功能 性 的 子 特性 包括 适 
用 性 CSuitability)、 准 确 性 (Accuracy)、 互 操作 性 (Interoperability) 和 安全 性 (Security) 
等 。 关 于 功能 子 质量 特性 的 详细 介绍 ,请 参考 章节 1. 1. 4。 


2.3.2 非 功 能 测试 


非 功能 需求 不 描述 功能 ,而 是 描述 功能 行为 的 属性 。 非 功能 测试 指 的 是 为 了 测量 系 
统 和 软件 的 特征 ,而 需要 进行 的 测试 。 这 些 特征 可 以 用 不 同 的 尺度 予以 量化 ,例如 进行 
性 能 测试 来 检验 响应 时 间 。 非 功能 测试 关注 的 是 被 测 对 象 的 表现 如 何 ,通常 采用 黑 盒 测 
试 设计 技术 分 析 和 设计 测试 用 例 。 

非 功 能 测试 可 以 在 任何 测试 级 别 上 执行 。 非 功能 测试 包括 但 不 限于 性 能 测试 .负载 
测试 .压力 测试 .可 用 性 测试 .可 维护 性 测试 .可 靠 性 测试 和 可 移植 性 测试 。 非 功能 性 测 
试 就 是 测试 系统 运行 的 表现 如 何 。 这 些 非 功 能 测试 可 以 参考 “软件 工程 一 软件 产品 质量 
(ISO 9126)” 中 定义 的 质量 模型 ,主要 包括 以 下 几 方面 。 

(1) 可 靠 性 ,主要 包括 成 熟 性 (Maturity)、 容 错 性 (Fault Tolerance)、 易 恢复 性 
(Recoverability) 和 可 靠 性 的 依从 性 (Reliability Compliance) 子 质量 特性 。 

(2) 易 用 性 ,主要 包括 易 理 解 性 (Understandability) 、 易 学 性 (Learnability) 、 易 操作 
性 (Operability) 吸引 性 (Attractiveness) 和 易 用 性 的 依从 性 (Usability Compliance) 子 质 
量 特性 。 

(3) 效率 ,主要 包括 时 间 特 性 (Time Behavior) ,资源 利用 性 (Resource Utilization) 和 
效率 的 依从 性 (Efficiency Compliance) 。 

(4) 可 维护 性 ,主要 包括 易 分 析 性 (Analysability)、 易 改变 性 (Changeability) ,稳定 性 
(Stability) , 易 测 试 性 (Testability) 和 可 维护 性 的 依从 性 (Maintainability Compliance) 。 

(5) 可 移植 性 ,主要 包括 适应 性 (Adaptability)、 易 安装 性 (Installability) 、 共 存 性 
(Co-Existence)、 易 替换 性 (Replaceability) 和 可 移植 性 的 依从 性 (Portability Compliance) 。 

关于 非 功能 子 质量 特性 的 详细 介绍 ,请 参考 章节 1. 1. 4。 

测试 中 经 常 面临 的 一 个 问题 是 非 功能 性 的 需求 描述 不 准确 和 不 完备 ,例如 系统 应 该 
易于 操作 或 者 系统 应 该 是 快速 的 ,该 类 型 的 需求 描述 不 满足 可 测试 性 要 求 。 测 试 人 员 尽 
早 参与 需求 评审 ,以 确认 非 功能 需求 满足 可 测试 要 求 。 此 外 ,有些 非 功能 需求 大 家 已 经 
习以为常 ,因此 没有 在 需求 分 析 中 提 到 它们 (假定 的 事实 ), 即 使 是 这 样 的 需求 ,测试 人 员 
也 必须 经 过 确认 。 在 功能 测试 过 程 中 检查 被 测 对 象 的 非 功能 特性 ,是 一 个 不 错 的 通用 的 
方法 。 
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2.3.3 结构 测试 


结构 测试 ,或 基于 结构 的 测试 , 即 白 盒 测试 ,是 通过 分 析 组 件 或 系统 内 部 结构 而 进行 
的 测试 。 白 盒 测 试 分 析 的 结构 可 以 是 各 种 类 型 的 ,例如 代码 的 控制 流 结构 、 模 块 /组 件 的 
调用 结构 ,菜单 结构 ,业务 流程 结构 ,或 者 软件 系统 的 抽象 模型 ,如 过 程 流 模 型 或 状态 转 
换 模型 等 。 

基于 结构 的 测试 可 以 应 用 于 任何 测试 级 别 , 通 过 评估 覆盖 结构 类 型 的 程度 来 衡量 测 
试 的 完整 性 。 例 如 ,基于 代码 结构 进行 的 语句 覆盖 测试 ,可 以 用 来 评估 可 执行 语句 的 覆 
盖 程 度 , 从 而 判断 测试 的 完整 性 。 覆 盖 率 是 通过 一 组 测试 用 例 能 检验 到 软件 结构 的 范 
围 ,以 覆盖 条 目的 百分比 来 表示 。 假 如 覆盖 率 没 有 达到 100% ,可 能 需要 设计 更 多 的 测试 
用 例 , 来 测试 被 遗漏 的 条 目 , 从 而 提高 测试 的 覆盖 率 。 例 如 如 果 测 试 达到 100 儿 的 语句 覆 
盖 率 ,表示 测试 已 经 覆盖 到 了 所 有 被 测 对 象 的 可 执行 语句 至 少 一 次 。 

基于 结构 的 测试 的 目的 是 设计 并 运行 足够 的 测试 用 例 ( 如 果 可 能 的 话 ) 来 完全 莉 盖 
所 有 的 结构 条 目 。 基 于 代码 结构 的 测试 ,通常 可 以 利用 工具 来 测量 代码 的 覆盖 率 , 例 如 
语句 覆盖 率 和 判定 履 盖 率 。 

(1) 100% 语 名 获 盖 率 : 选择 足够 的 测试 用 例 ,使 得 代码 中 每 一 条 可 执行 语句 至 少 被 
执行 一 次 。 

(2) 100%% 判 定 覆 盖 率 : 选择 足够 的 测试 用 例 ,使 得 代码 中 每 一 个 判定 /分 支 的 每 一 
种 可 能 结果 ( 取 真 或 取 假 ) 都 至 少 被 执行 一 次 。 


2.3.4 与 变更 相关 的 测试 


与 变更 相关 的 测试 主要 包括 确认 测试 (或 者 再 测试 ) 和 回归 测试 。 

在 测试 过 程 或 使 用 过 程 中 若 发 现 软件 的 缺陷 ,开发 人 员 需 要 修改 缺陷 ,修改 完 后 需 
要 测试 人 员 对 修改 的 部 分 进行 再 测试 ,以 确保 修改 是 正确 和 有 效 的 ,这 称 为 确认 测试 或 
再 测试 。 确 认 测试 的 目的 是 重新 执行 上 次 失败 的 测试 用 例 ,以 确定 开发 人 员 是 否 已 成 功 
地 修改 了 缺陷 。 

当 软 件 系统 发 生变 更 时 ,例如 修复 缺陷 .系统 计划 的 功能 增强 .系统 使 用 环境 的 变化 
等 ,可 能 会 影响 到 软件 系统 的 其 他 没 变 更 的 区 域 ,造成 那里 出 现 新 的 缺陷 ,所 以 要 对 可 能 
会 受到 影响 的 区 域 进行 测试 , 称 为 回归 测试 。 回 归 测 试 的 目的 是 测试 先前 测试 过 并 修改 
过 的 程序 ,确保 更 改 没 有 给 软件 其 他 未 改变 的 部 分 带 来 新 的 缺陷 ,或 发 现 以 前 被 屏蔽 的 
缺陷 。 回 归 测试 的 规模 可 以 根据 在 以 前 正常 运行 的 软件 中 发 现 新 的 缺陷 的 风险 大 小 来 
决定 。 

确认 测试 和 回归 测试 应 该 可 以 重复 进行 。 

回归 测试 可 以 在 所 有 的 测试 级 别 上 进行 ,同时 适用 于 功能 测试 、 非 功能 测试 和 结构 
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测试 。 回 归 测 试 中 使 用 的 测试 用 例 往往 会 运行 很 多 次 ,并 且 相 对 稳定 ,同时 回归 测试 一 
般 会 要 求 在 较 短 的 时 间 内 完成 ,因此 将 回归 测试 自动 化 是 很 好 的 选择 。 

为 了 有 效 地 开展 回归 测试 ,测试 人 员 还 需要 确定 回归 测试 的 策略 。 

策略 1 一 一 零 回归 : 只 执行 发 现 缺 陷 的 测试 用 例 , 确 认 缺 陷 的 修改 是 正确 和 有 效 的 ， 
该 策略 只 做 了 再 测试 或 确认 测试 ,并 没有 进行 回归 测试 ,所 以 系统 会 存在 很 大 的 风险 。 

策略 2 一 一 基于 影响 分 析 的 回归 : 由 于 变更 而 导致 的 被 测 对 象 代码 修改 会 影响 系统 
其 他 部 分 的 功能 ,因此 该 策略 基于 代码 变更 的 影响 分 析 , 需 要 重新 执行 由 于 修改 缺陷 或 
增加 新 功能 而 受到 影响 的 代码 ,以 及 与 此 相关 的 测试 用 例 ; 由 于 软件 的 复杂 性 ,特别 是 经 
常 面临 的 需求 文档 缺乏 的 挑战 ,导致 影响 分 析 变 得 困难 。 

策略 3 一 一 完全 回归 : 除了 对 由 于 修改 缺陷 和 新 增 功能 而 导致 的 代码 变化 部 分 进行 
测试 之 外 ,还 重新 执行 已 有 的 所 有 其 他 测试 用 例 。 该 策略 相当 安全 ,但 是 在 有 限 的 时 间 、 
成 本 和 资源 情况 下 ,很 难 有 效 实施 。 

完全 回归 策略 费时 费力 ,成 本 很 高 。 因 此 策略 2 一 一 基于 影响 分 析 的 回归 应 该 是 测 
试 人 员 追 求 的 策略 。 通 过 影响 分 析 选 择 合适 的 测试 用 例 ,以 最 大 程度 地 减少 被 测 对 象 中 
的 缺陷 。 在 测试 过 程 中 ,这 意味 着 风险 和 成 本 的 平衡 。 通 过 影响 分 析 , 对 变更 导致 的 风 
险 进行 详细 分 析 ,以 确定 负面 影响 可 能 发 生 的 地 方 以 及 造成 的 严重 程度 , 即 回归 测试 范 
围 可 以 根据 变更 引起 的 风险 决定 ,常用 的 方法 有 : 

(1) 只 重复 测试 计划 中 的 高 优先 级 的 测试 用 例 。 

(2) 只 针对 系统 的 特定 配置 开展 测试 ,例如 针对 英文 版 产品 的 测试 或 者 针对 一 个 操 
作 系统 版 本 的 测试 。 

(3) 只 针对 特定 子 系统 或 测试 级 别 的 测试 。 


@.4 维护 测试 


软件 系统 一 旦 发 布 ,通常 会 服务 几 年 甚至 几 十 年 。 在 软件 运行 期 间 , 经 常 需要 对 软 
件 系统 和 它 运行 的 环境 进行 修正 改变 或 扩展 ,这 就 需要 维护 测试 。 维 护 测试 在 一 个 现 
有 的 运行 系统 上 进行 , 且 一 旦 对 软件 或 系统 进行 修改 、 移 植 或 退役 处 理 时 ,就 需要 进行 维 
护 测 试 。 

(1) 修改 可 以 是 计划 中 的 功能 增加 (例如 根据 版 本 发 布 的 计划 ) ,修正 和 应 急 变 更 \ 环 
境 的 变化 。 例 如 计划 中 的 操作 系统 或 数据 库 升 级 ,为 商业 现货 软件 计划 升级 或 由 于 新 发 
现 或 暴露 的 操作 系统 漏洞 而 打 的 补丁 等 。 

(2) 为 移植 (例如 从 一 个 平台 移植 到 另外 一 个 平台 ) 而 进行 的 维护 测试 应 该 包括 新 环 
境 的 运行 测试 ,以 及 对 变更 以 后 的 软件 的 运行 测试 。 当 数据 从 另 一 个 应 用 程序 移植 到 正 
在 维护 的 系统 时 ,需要 移植 测试 (转换 测试 ) 。 

(3) 为 系统 退役 而 进行 的 维护 测试 应 该 包括 数据 移植 测试 ,或 当 数据 要 长 时 间 保 存 
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时 还 需 进行 存档 测试 。 

除了 对 软件 变更 进行 测试 外 ,维护 测试 还 包括 对 系统 没有 发 生变 更 的 其 他 部 分 进行 
的 回归 测试 。 维 护 测试 的 范围 取决 于 变更 的 风险 、 系 统 的 规模 和 变更 的 大 小 。 维 护 测试 
根据 变更 的 情况 不 同 ,可 以 在 某 一 或 所 有 的 测试 级 别 和 测试 类 型 上 进行 测试 。 确 定 变 更 
如 何 影响 现 有 系统 的 过 程 , 称 为 影响 分 析 , 它 可 以 帮助 决定 实施 回归 测试 的 广度 和 深度 。 

假如 需求 说 明 遗 失 或 过 时 ,进行 维护 测试 将 是 一 件 困难 的 事情 。 然 而 这 是 维护 测试 
经 常 面临 的 问题 ,因为 维护 测试 可 能 是 软件 开发 很 久 以 后 的 事情 ,假如 没有 完善 的 项 目 
开发 过 程 测试 过 程 和 文档 管理 控制 过 程 ,维护 测试 所 依赖 的 测试 依据 是 很 难保 持 更 
新 的 。 


@.5 习题 


(K1) 软 件 组 件 测试 的 主要 目的 是 ( Ns 

. 测试 组 件 与 组 件 之 间 的 接口 

. 测试 组 件 和 硬件 的 关联 

. 发现 缺 陷 , 以 及 验证 组 件 的 功能 

. 验证 系统 的 功能 

(K1) 关 于 测试 类 型 的 应 用 范围 ,下 面 哪个 是 正确 的 ?( 
.结构 测试 只 能 用 在 组 件 测试 或 集成 测试 

功能 测试 只 能 用 在 系统 测试 或 验收 测试 

. 白 盒 测试 方法 不 能 用 于 系统 测试 

.功能 测试 和 结构 性 测试 可 以 应 用 在 任何 测试 级 别 

(K1) 关 于 维护 测试 ,下 列 哪个 选项 是 正确 的 ?( ) 
. 在 软件 系统 交付 给 用 户 真正 使 用 之 前 必须 进行 维护 测试 
. 在 每 个 测试 级 别 都 需要 进行 维护 测试 

. 维护 测试 是 在 一 个 现 有 的 运行 系统 上 运行 的 测试 

. 在 一 个 现 有 的 运行 系统 中 ,因为 开发 已 经 完成 了 ,所 以 不 再 需要 测试 
4.(K1) 典 型 V 模型 的 测试 级 别 分 别 是 什么 ? ) 

(1) 组 件 测试 

(2) 集成 测试 

(3) 系统 测试 

(4) 维护 测试 

(5) 验收 测试 

A Ct dy 

BL CIVC2Y, Ce CIA 


(= 


C 
D 
5. 
A 
B 
C， 
D 
6 
A 
B 
C 
D 


2 


第 2 章 ”软件 生命 周期 中 的 测试 


(1),(2),(3),(5) 
(1),(2),(3),(4),(5) 


(K1) 下 列 关 于 增 量 迭代 开发 模型 描述 错误 的 是 ( Ns 


. 在 每 次 迭代 过 程 中 ,对 和 迭代 产生 的 系统 可 能 需要 在 不 同 的 测试 级 别 上 进行 测试 
. 增 量 -迭代 开发 模型 由 于 发 布 周 期 更 短 , 所 以 要 优 于 V 模型 


随 着 迭代 的 不 断 发 布 ,回归 测试 的 重要 性 越 来 越 大 


. 验证 和 确认 可 以 在 每 个 增 量 模块 中 进行 

.Kl1) 以 下 哪个 不 属于 良好 的 测试 应 该 具有 的 特点 是 (。”)。 

. 每 个 开发 活动 都 有 相对 应 的 测试 活动 

. 每 个 测试 级 别 都 有 其 特有 的 测试 目标 

.对 于 每 个 测试 级 别 ,需要 在 相应 的 开发 活动 过 程 中 进行 相应 的 测试 分 析 和 设计 
. 在 开发 生命 周期 中 ,测试 人 员 应 该 在 文档 正式 发 布 后 再 参与 文档 的 评审 


(K1) 对 于 每 个 测试 级 别 , 都 需要 明确 哪些 内 容 ?( ) 


(1) 测试 的 总 体 目标 

(2) 测试 用 例 设 计 需 要 参考 的 工作 产品 ( 即 测试 的 依据 ) 
(3) 测试 的 对 象 ( 即 测试 什么 ) 

(4) 发 现 的 典型 缺陷 和 失效 

(5) 对 测试 用 具 (Test Harness) 的 需求 

(6) 测试 工具 的 支持 

(7) 专门 的 方法 和 职责 


A 


B. 
C. 
D 
8. 
A 
B. 
C. 
D 
9. 
A 
B. 
C. 
D 


10. 


A. 


(1),(2),(3),(4) 
(1),(3),(5),(6),(7) 

(2) ,C3),(4),(5),(6) 

(1),(2),(3),(4),(5),(6),(7) 

(K2) 下 面 哪个 通常 不 作为 组 件 /单元 测试 的 测试 依据 ? (  ) 


. 组 件 需 求 说 明 


详细 设计 文档 

代码 

系统 设计 文档 

(K2) 下 面 关于 验收 测试 的 观点 错误 的 是 ( $s 


. 系统 操作 验收 测试 主要 由 系统 管理 员 执 行 


验收 测试 主要 应 用 于 系统 测试 级 别 

Alpha 测试 通常 在 开发 组 织 现场 进行 ,但 测试 并 非 由 开发 团队 执行 

Beta 测试 是 在 客户 /用 户 或 潜在 客户 /用 户 现场 进行 ,并 一 般 由 客户 /用 户 执行 
(K2) ISTQB 认为 关于 测试 人 员 加 入 项 目的 时 间 ,哪个 建议 是 最 合适 的 ? ( ) 
在 项 目 启 动 的 时 候 就 安排 测试 人 员 加 入 


NA 
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B. 
CG 
D, 


Ds 


A. 
B; 
C. 
BD 


12. 


在 需求 分 析 完 成 之 后 安排 测试 人 员 加 入 

在 代码 完成 之 后 安排 测试 人 员 加 入 

在 详细 设计 完成 之 后 安排 测试 人 员 加 入 

(K1) 系 统 测 试 的 主要 关注 点 是 (  )。 

某 个 独立 功能 组 件 是 否 正确 实现 

某 个 功能 组 件 是 否 满足 设计 要 求 

所 定义 的 整个 系统 或 者 产品 的 行为 

组 件 之 间接 口 的 一 致 性 

(K2) 关 于 集成 测试 的 论点 ,下 面 描述 错误 的 是 ( ”)。 

集成 测试 的 范围 越 大 ,从 特定 组 件 或 系统 中 分 离 出 失效 就 越 困 难 


.集成 测试 只 有 自 项 向 下 或 自 底 向 上 两 种 集成 方法 
.为 了 减少 在 生命 周期 后 期 发 现 缺 陷 而 产生 的 风险 ,集成 程度 应 该 逐步 增加 


集成 测试 时 ,测试 人 员 应 该 重点 关注 组 件 之 间 的 接口 


. (K1) 设 计 系统 测试 用 例 时 ,下 面 哪些 测试 依据 是 可 以 参考 的 ? 〈 
.风险 分 析 得 到 的 结果 
.系统 需求 说 明 


用 例 (Use Case) 


.业务 流程 (Business Flow) 


asb 

b 

a,b,d 

全 部 都 是 

(Kl1) 下 面 属于 功能 测试 的 是 ( 沪 


. 安全 性 测试 


可 靠 性 测试 


.可 维护 性 测试 
.负载 测试 


学 习 目 标 
编号 学 习 目 标 描述 
LO-3.1.1 了解 可 以 通过 不 同 的 静态 技术 来 检查 软件 工作 产品 的 质量 
LO-3.1.2 ”描述 在 评估 软件 工作 产品 中 运用 静态 技术 的 重要 性 和 它 的 价值 
LO-3.1.3 ”结合 测试 对 象 \ 缺 陷 类 型 来 说 明 静 态 测试 技术 与 动态 测试 技术 
之 间 的 不 同 ,以 及 这 些 技 术 在 软件 生命 周期 中 的 作用 
LO-3.2.1 理解 典型 的 正式 评审 过 程 中 的 阶段 .角色 和 职责 定义 
LO-3.2.2 解释 不 同类 型 评审 的 区 别 : 非 正式 评审 、 技 术 评审 . 走 查 和 审查 
LO-3.2.3 解释 影响 评审 成 功 的 主要 因素 
LO-3. 3.1 ”理解 通过 静态 分 析 能 够 识别 的 典型 缺陷 和 错误 ,并 与 评审 和 动 
态 测试 进行 比较 
LO-3. 3.2 ”举例 描述 静态 分 析 的 主要 优点 
LO-3.3.3 ” 列 出 通过 静态 分 析 工 具 识别 的 典型 的 代码 缺陷 和 设计 缺陷 


级 别 


K2 
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术语 
术 语 含义 解释 
De en 动态 测试 通过 运行 软件 的 组 件 或 系统 来 测试 软件 
人 对 组 件 /系统 进行 规格 或 实现 级 别 的 测试 ,而 不 是 的 
td 和 行 这 个 软件 ,例如 代码 评审 或 静态 代码 分 析 
进入 下 个 任务 (如 测试 阶段 ) 必 须 满足 的 条 件 。 准 大 
yi 入 口 准则 条 件 的 目的 是 防止 执行 不 能 满足 准 入 条 件 的 活动 而 
浪费 资源 
Boel Re 正式 评审 对 评审 过 程 及 需求 文档 化 的 一 种 特定 的 评审 ,例如 审查 
有 非 正式 评审 一 种 不 基于 正式 (文档 化 ) 过 程 的 评审 。 
二 种 同 级 评审 ,通过 检查 文档 以 检测 缺陷 ,例如 不 符 
人 合 开发 标准 \ 不 符合 更 上 层 的 文档 等 。 这 是 最 正式 的 
评审 技术 ,因此 总 是 基于 文档 化 的 过 程 。 参 
见 Peerreview 
二 度量 测量 所 使 用 的 方法 或 者 度量 标准 
Me 主持 人 负责 检视 或 其 他 评审 过 程 的 负责 人 或 主要 人 员 
由 研发 产品 的 同事 对 软件 产品 进行 的 评审 ,目的 在 于 
Per Rerier 同行 评审 识别 缺陷 并 改进 产品 ,例如 审查 、 技 术 评审 和 走 查 
参与 评审 的 人 员 ,辨识 并 描述 被 评审 产品 或 项 目 中 的 
本 评审 人 异常 。 在 评审 过 程 中 ,可 以 选择 评审 人 员 从 不 同 角度 
评审 或 担当 不 同 角色 
在 评审 会 议 中 将 每 个 提 坟 的 缺陷 和 任何 过 程 改进 建 
5 记录 员 议 记 录 到 日 志 表 单 上 的 人 员 , 记 录 员 要 确保 日 志 表 音 
易于 阅读 和 理解 
ee ， 二 种 同行 间 的 小 组 讨论 活动 ,主要 为 了 对 所 采用 的 技 
Tostinioal Revlew 人 术 实现 方法 达成 共识 。 参 见 Peer Review 
由 文档 作者 逐步 陈述 文档 内 容 , 以 收集 信息 并 对 内 容 
Wolsey a 达成 共识 。 参 见 Peer Review 
系统 或 组 件 的 设计 和 /或 内 部 结构 难于 理解 .维护 或 
人 区 光 作 验证 的 程度 ,参见 Cyclomatic Complexity 
程序 中 独立 路 径 的 数量 。 一 种 代码 复杂 度 的 衡量 标 
准 ,用 来 衡量 一 个 模块 判定 结构 的 复杂 程度 ,数量 上 表 
现 为 独立 现行 路 径 条 数 , 即 合理 的 预防 错误 所 需 测试 
| ee 的 最 少 路 径 条 数 。 圈 复杂 度 大 说 明 程序 代码 可 能 质量 


低 且 难于 测试 和 维护 ,根据 经 验 ,程序 的 可 能 错误 和 
高 的 圈 复 杂 度 有 着 很 大 关系 。 圈 复杂 度 二 L 一 NN 十 
2P, 其 中 工 表示 为 结构 图 (程序 图 ) 的 边 数 ; N 为 结构 
图 (程序 图 ) 的 节点 数目 ; P 为 无 链接 部 分 的 数目 


续 表 
术 语 含义 解释 
二 控制 流 执行 组 件 或 系统 中 的 一 系列 顺序 发 生 的 事件 或 路 径 
a Se 数据 对 象 的 顺序 的 和 可 能 的 状态 变换 的 抽象 表示 ,对 
A 象 的 状态 可 以 是 创建 .使 用 和 销毁 
行 这 些 
es 分 析 软 件 工件 (如 需求 或 代码 ), 而 不 执行 这 些 工作 


产品 


6.) 静态 技术 和 测试 过 程 


与 要 求 运 行 软件 的 动态 测试 技术 不 同 ,静态 测试 技术 通过 手工 检查 (评审 ) 或 自动 化 
分 析 ( 静 态 分 析 ) 方 式 对 代码 或 者 其 他 的 项 目 文档 进行 检查 而 不 需要 执行 代码 。 静 态 测 
试 的 主要 目的 是 从 已 有 的 说 明 ( 例 如 需求 说 明 、 设 计 说 明 等 )、 已 定义 的 标准 或 项 目 计 划 
和 程序 代码 中 发 现 缺陷 和 偏差 。 静 态 测 试 的 基本 思想 是 预防 缺陷 . 尽 可 能 早 地 在 缺陷 和 
偏差 对 将 来 的 开发 过 程 和 测试 过 程 产生 影响 之 前 识别 并 解决 它们 ,避免 将 这 些 缺 陷 引入 
到 下 一 个 阶段 ,从 而 导致 昂贵 的 返工 。 同 时 ,静态 测试 的 结果 以 及 对 结果 的 分 析 , 可 以 有 
效用 于 软件 质量 改进 以 及 开发 过 程 和 测试 过 程 的 改进 。 

静态 测试 包括 人 工 检查 (评审 ) 和 自动 化 检查 (静态 分 析 ) ,是 一 个 经 常 被 低估 或 者 被 
忽略 的 方法 。 和 动态 测试 不 同 ,静态 测试 不 需要 实际 执行 测试 对 象 和 输入 测试 数据 ,而 
是 用 阅读 和 分 析 蔡 代 具 体 的 运行 系统 。 也 就 是 说 ,利用 静态 测试 技术 进行 测试 时 ,并 没 
有 真正 地 运行 被 测 对 象 ,而 是 通过 人 工 或 者 自动 化 的 方式 对 被 测 对 象 进行 检查 和 分 析 。 

静态 测试 可 以 是 一 个 或 多 个 人 一 起 检查 文档 (评审 ) ,或 使 用 特定 的 工具 来 完成 文档 
或 者 代码 的 检查 (静态 分 析 ) 。 软 件 开发 项 目 中 的 所 有 文档 都 可 以 通过 人 工 方式 来 检查 。 
对 遵循 特定 规则 的 文档 可 以 通过 工具 进行 静态 分 析 。 对 于 代码 , 既 可 以 通过 评审 的 方式 
人 工 进行 检查 (如 代码 走 查 ) ,也 可 以 通过 工具 进行 自动 化 的 静态 分 析 。 

评审 是 静态 测试 的 重要 组 成 部 分 。 通 过 阅读 分 析 可 以 检查 和 评估 文档 中 的 问题 , 具 
体 是 通过 透彻 阅读 并 尝试 理解 被 检查 的 文档 来 完成 评审 。 它 是 对 软件 工作 产品 (包括 代 
码 ) 进 行 测试 的 一 种 方式 ,评审 可 以 在 动态 测试 之 前 ,也 可 以 在 任何 其 他 阶段 进行 ,例如 
可 以 对 需求 文档 进行 评审 ,也 可 对 执行 测试 结束 后 得 出 的 测试 总 结 报告 进行 评审 。 修 改 
在 软件 生命 周期 的 早期 发 现 的 缺陷 的 成 本 要 比 修改 在 后 期 的 动态 测试 中 才 发 现 的 缺陷 
的 成 本 低 得 多 。 例 如 由 于 需求 理解 错误 引起 的 错误 ,在 早期 评审 过 程 中 发 现 和 修改 该 缺 
陷 只 要 花费 较 低 的 代价 ,如 果 等 到 完成 设计 工作 并 生成 代码 ,再 通过 动态 测试 发 现 和 修 
改 该 缺陷 时 需要 花费 更 高 的 代价 。 如 果 该 缺陷 影响 到 系统 的 架构 等 核心 部 分 , 则 导致 的 
返工 费用 将 会 更 加 昂贵 。 

进行 人 工 评审 的 主要 活动 是 检查 软件 工作 产品 ,并 对 它们 提出 修改 意见 。 评 审 的 主 
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要 好 处 有 尽早 发 现 和 修改 缺陷 .改善 开发 能 力 、 缩 短 开发 时 间 、 缩 减 测试 成 本 和 时 间 、 减 
少 产品 生命 周期 成 本 ` 减 少 软件 缺陷 以 及 改善 和 开发 人 员 之 间 的 沟通 等 。 评 审 也 可 以 在 
软件 工作 产品 中 发 现 一 些 遗漏 或 者 元 余 的 内 容 , 而 这 在 动态 测试 中 是 很 难 发 现 的 。 

静态 分 析 是 静态 测试 的 另 一 个 重要 组 成 部 分 。 它 一 般 是 通过 工具 支持 的 方式 来 进 
行 的。 静态 分 析 可 以 根据 工作 强度 ,形式 、 必 需 的 资源 (人 员 和 时 间 ) 以 及 目的 的 不 同 , 进 
行 不 同 的 分 类 。 

静态 测试 (评审 、 静 态 分 析 ) 与 动态 测试 有 着 共同 的 目标 , 即 识别 缺陷 。 但 静态 测试 
与 动态 测试 也 有 所 不 同 , 静 态 测试 直接 发 现 文档 或 代码 中 的 缺陷 ,而 不 是 它们 的 外 部 表 
现 , 即 失效 。 而 动态 测试 通过 运行 被 测 对 象 ,在 运行 过 程 中 发 现 被 测 对 象 的 缺陷 的 外 部 
表现 , 即 失效 。 它 们 之 间 是 相辅相成 的 ,不 同 的 技术 可 以 有 效 地 发 现 不 同 的 错误 类 型 ( 缺 
陷 和 失效 ) 。 

与 动态 测试 相 比 ,静态 测试 更 容易 发 现 如 下 问题 : 与 标准 之 间 的 偏差 需求 的 遗漏 和 
错误 .设计 的 缺陷 .软件 可 维护 性 差 和 错误 的 接口 说 明 等 ,而 这 些 文档 往往 在 动态 测试 过 
程 中 作为 重要 的 测试 依据 。 如 果 这 些 作为 动态 测试 依据 的 文档 的 质量 无 法 保障 , 则 动态 
测试 本 身 的 质量 也 就 值得 怀疑 ,更 无 法 有 效 保障 被 测 对 象 的 质量 。 


6.2 评审 


评审 类 型 是 多 样 化 的 , 既 可 以 是 不 正式 的 评审 ,例如 评审 员 没有 文档 化 的 指导 性 资 
料 可 参考 ,也 可 以 是 正式 的 评审 ,例如 有 团队 参与 . 且 有 文档 化 的 审查 结果 和 管理 审查 的 
步骤 。 评 审 过 程 的 正式 程度 和 开发 过 程 的 成 熟 度 、 法 律 法 规 方面 的 要 求 或 审核 跟踪 的 需 
要 相关 。 

采取 什么 样 的 评审 类 型 由 评审 的 目标 决定 .评审 目标 可 以 是 发 现 缺 陷 、 增 加 理解 、 培 
训 测 试 人 员 和 团队 其 他 成 员 或 对 讨论 和 决定 达成 共识 等 。 


3.2.1 正式 评审 过 程 


为 了 有 效 管理 和 监控 评审 ,需要 定义 正式 而 系统 的 评审 过 程 , 即 定义 详细 的 阶段 和 
活动 。 正 式 的 评审 过 程 由 6 个 阶段 组 成 : 计划 阶段 ,预备 会 阶段 (Kick Off Meeting) ,个 
人 准备 阶段 .评审 会 议 阶段 .返工 阶段 和 跟踪 结果 阶段 (参考 IEEE Std 1028-1997) 。 


1. 计划 阶段 


为 了 有 效 开 展 评审 活动 ,首先 需要 进行 评审 计划 。 评 审计 划 阶 段 主要 确定 评审 对 象 
和 评审 目的 ,该 阶段 的 主要 活动 包括 测试 经 理 或 管理 者 选择 主持 人 ; 与 主持 人 一 起 选择 
评审 员 、 分 配角 色 和 职责 ; 为 正式 的 评审 类 型 (例如 审查 ) 定 义 人 口 准则 和 出 口 准则 ; 选 


择 需 要 进行 评审 的 文档 或 文档 章节 ,以 及 针对 更 加 正式 的 评审 类 型 核对 入 口 准则 。 

管理 层 必须 在 项 目 计 划 过 程 中 ,确定 软件 开发 过 程 中 的 哪些 文档 需要 进行 评审 , 谁 
将 参与 评审 以 及 采用 什么 评审 类 型 。 在 项 目 计 划 中 必须 估算 评审 的 工作 量 。 在 评审 计 
划 期 间 , 主 持 人 需要 选择 合适 的 评审 员 组 成 评审 团队 。 通 过 和 评审 文档 的 作者 一 起 , 确 
保 文档 处 于 可 评审 的 状态 , 即 文档 已 经 完备 并 且 文 档 相 关 的 工作 已 经 完成 。 针 对 更 正式 
的 评审 ,还 需要 设 定 和 检查 入 口 准则 以 及 设 定 出 口 准 则 。 

通常 情况 下 ,从 不 同 的 角度 对 文档 进行 评审 ,或 每 个 人 只 针对 文档 的 某 个 方面 进行 
评审 ,可 以 使 评审 更 加 容易 成 功 。 评 审计 划 阶 段 需 要 确定 评审 的 关注 点 。 假 如 评审 的 目 
的 是 为 了 检查 文档 的 基本 质量 ,可 以 只 对 文档 的 高 风险 部 分 进行 评审 ,或 对 评审 对 象 进 
行 抽样 ,并 对 抽样 的 内 容 进 行 评审 。 

假如 需要 针对 评审 召开 预备 会 ,必须 选 定 预备 会 议 的 时 间 和 地 点 。 


假如 评审 计划 中 无 法 明确 一 些 事 情 和 注意 事项 ,有 时 候 在 评审 计划 之 后 ,还 需要 召 
开 评 审 预备 会 。 主 持 人 召集 评审 员 进 行 一 个 简短 的 会 议 ,向 评审 员 介绍 评审 的 对 象 、 评 
审 的 目的 、 评 审 的 过 程 、 入 口 准 则 和 出 口 准则 ,给 评审 员 分 派 评 审 任务 和 分 发 相关 文档 ， 
以 及 介绍 其 他 一 些 需 要 注意 的 事项 。 


3. 个 人 准备 阶段 


评审 员 明确 了 评审 目的 和 各 自 的 任务 之 后 , 接 下 来 进入 个 人 准备 阶段 。 即 在 评审 会 
议 之 前 ,每 位 评审 员 仔 细 阅 读 各 自负 责 的 评审 内 容 .并 根据 提供 的 参考 文档 检查 评审 对 
象 , 标 注 评审 对 象 中 可 能 的 不 足 、 问 题 、 意 见 和 建议 。 评 审 员 的 充分 准备 是 成 功 进行 评审 
的 一 个 重要 前 提 条 件 。 


4. 评审 会 议 阶 段 


假如 满足 了 评审 的 入 口 准则 ,就 可 以 进入 评审 会 议 阶 段 。 该 阶段 的 主要 活动 包括 通 
过 文档 化 或 会 议 纪 要 (针对 更 正式 的 评审 类 型 ) 的 方式 讨论 和 记录 评审 过 程 和 结果 。 评 
审 员 也 可 以 简单 地 标识 缺陷 ,提出 建议 来 处 理 缺陷 ,或 为 如 何 处 理 缺 陷 做 决定 。 

评审 会 议 由 主持 人 主持 ,主持 人 必须 保证 所 有 的 评审 员 能 够 客观 地 表达 他 们 的 观 
点 ,确保 评审 对 象 关 注 在 对 产品 的 评估 ,而 不 是 对 作者 的 评估 ,并 且 预 防 或 解决 评审 过 程 
中 可 能 出 现 的 问题 和 冲突 。 主 持 人 需要 有 良好 的 交际 能 力 和 技巧 ,以 保证 评审 会 议 按照 
预期 的 目标 进行 ,并 激励 参与 人 员 为 评审 做 出 最 大 的 贡献 。 

通常 来 说 ,评审 会 议 的 时 间 有 限 。 评 审 的 目的 除了 发 现 缺 陷 外 ,还 包括 判断 评审 对 
象 是 否 满足 需求 .是 否 符合 标准 。 评 审 的 结果 一 般 有 接受 有 条 件 接受 和 不 接受 。 所 有 
的 评审 员 应 该 对 这 次 评估 的 决定 和 综合 结果 达成 一 致 

下 面 是 评审 会 议 阶段 需要 注意 的 一 些 通 用 准则 。 
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(1) 评审 会 议 的 时 间 尽 量 控制 在 2 个 小 时 内 。 如 果 需 要 ,可 以 在 当天 再 发 起 另外 一 
个 评审 会 议 。 

(2) 如 果 一 个 或 多 个 专家 (评审 员 ) 没 有 出 席 , 或 者 他 们 没有 准备 充分 ,主持 人 有 权 取 
消 或 中 止 会 议 。 

(3) 评审 的 对 象 是 文档 ,而 不 是 作者 ,因此 确保 大 家 关注 评审 对 象 ,而 不 是 作者 ,这 
包括 ， 

@ 评审 员 必 须要 注意 他 们 的 言语 以 及 表达 的 方式 。 

@ 作者 不 应 该 成 为 被 攻击 的 对 象 。 作 者 应 该 把 他 人 提出 的 意见 和 建议 当 作 自 己 学 
习 和 提高 的 机 会 ,并 在 必要 时 对 自己 的 作品 进行 解释 。 

(4) 主持 人 不 应 该 同时 作为 评审 员 。 

(5) 修改 方案 的 讨论 不 是 评审 的 任务 。 

(6) 每 个 评审 员 必 须 有 机 会 充分 地 表达 他 们 的 观点 。 

(7) 会 议 纪要 必须 充分 表达 评审 员 的 意见 。 

(8) 评审 会 议 中 提交 的 问题 不 应 该 以 命令 的 形式 提交 给 作者 (中 肯 的 改进 或 修改 建 
议 有 时 候 对 质量 改进 是 有 帮助 的 ,并 且 是 明智 的 ) 。 

(9) 针对 不 同 的 问题 ,划分 不 同 的 严重 程度 ,缺陷 按照 严重 程度 分 为 : 

@ 严重 缺陷 (例如 评审 对 象 不 能 满足 设计 的 目的 ,在 批准 评审 对 象 之 前 必须 修正 相 
关 缺 陷 )， 

@ 重要 缺陷 (影响 评审 对 象 的 可 用 性 ,批准 评审 对 象 之 前 应 该 修改 相关 缺陷 )， 

@ 一 般 缺 陷 ( 小 的 偏差 ,基本 不 影响 使 用 ) 。 

(10) 评审 团队 应 该 对 评审 对 象 给 出 最 后 的 意见 ,例如 : 

QO 接受 (无 需 修改 ); 

@ 有 条 件 接受 (需要 修改 ,但 不 需要 进一步 评审 ); 

@ 不 接受 (需要 进一步 评审 或 其 他 的 检查 措施 ) 。 

(11) 会 议 最 后 ,所 有 参加 人 员 需 要 签署 最 终 的 会 议 纪要 。 

会 议 纪要 应 包括 会 议 中 讨论 的 所 有 问题 和 异常 现象 。 另 外 ,评审 总 结 报告 应 该 收集 
评审 过 程 中 所 有 的 信息 和 数据 ,包括 评审 对 象 . 涉 及 的 人 员 、 人员 的 角色 .重要 问 题 的 简 
短 总 结 以 及 评审 员 建 议 的 评审 结果 。 当 执行 正式 的 评审 时 ,还 需要 检查 正式 的 出 口 
准则 。 


5. 返工 阶段 


返工 阶段 的 主要 活动 是 修改 发 现 的 缺陷 ,通常 由 作者 负责 返工 工作 。 作 者 同时 需要 
更 新 相应 的 文档 或 者 代码 ,以 及 更 新 之 后 的 发 布 等 。 


6. 跟踪 结果 阶段 
跟踪 结果 阶段 的 主要 活动 包括 检查 缺陷 是 否 已 修改 ,收集 度量 和 检查 出 口 准则 ( 针 


对 更 正式 的 评审 类 型 ) 。 

通常 需要 指定 专门 的 人 负责 跟踪 缺陷 的 修改 ,例如 主持 人 本 人 、 主 持 人 指定 的 其 他 
人 。 假 如 评审 的 结果 为 “不 接受 ”, 那 么 需要 安排 另外 一 次 评审 。 重 新 进行 评审 的 过 程 可 
以 采用 正式 的 评审 过 程 ,由 于 时 间 和 成 本 等 原因 ,通常 情况 下 会 采用 更 简单 的 方式 。 重 
新 评审 一 般 只 对 修改 部 分 进行 检查 。 

接 下 来 需要 对 评审 过 程 和 评审 结果 进行 评估 ,为 评审 的 过 程 改进 提供 依据 。 例 如 根 
据 评 审结 果 ,修改 评审 检查 表 , 并 保持 它们 是 最 新 的 。 为 了 达到 这 个 目的 ,必须 收集 和 评 
佑 评审 相关 的 度量 数据 。 收 集 和 分 析 连 续 发 生 或 经 常 发 生 的 缺陷 类 型 , 找 出 其 根本 原 
因 , 然 后 针对 这 些 缺 陷 类 型 ,计划 和 实施 开发 过 程 和 测试 过 程 改 进 , 例 如 若 发 生 该 缺陷 类 
型 的 根本 原因 是 具体 人 员 的 知识 和 技能 不 足 ,可 以 通过 培训 进行 弥补 。 同 时 ,可 以 将 这 
些 缺 陷 类 型 加 到 评审 检查 表 中 ,以 提高 评审 的 效率 和 有 效 性 。 


3.2.2 角色 和 职责 


评审 过 程 中 需要 有 不 同 角色 的 人 参与 ,他 们 在 评审 中 的 职责 是 不 一 样 的 ,这 一 节 将 
会 对 不 同 的 角色 和 职责 进行 详细 描述 。 


1. 经 理 或 管理 者 


经 理 或 管理 者 决定 文档 或 者 代码 是 否 需要 进行 评审 , 若 需 要 , 则 在 项 目 计 划 中 保留 
和 分 配 足够 的 时 间 和 资源 。 同 时 :在 评审 结束 之 后 判断 是 否 达到 评审 的 目标 。 经 理 选择 
评审 对 象 并 确保 基础 文档 和 必需 的 资源 可 用 ,以 及 确定 主持 人 和 评审 员 的 人 选 ( 也 可 由 
主持 人 来 确定 评审 员 ) 。 

通常 不 建议 管理 者 或 者 管理 者 代表 参与 评审 会 议 ,主要 原因 如 下 。 

(1) 首先 ,文档 作者 或 评审 员 担 心经 理 或 管理 者 通过 评审 对 他 们 进行 考核 ,从 而 导致 
参加 的 评审 员 无 法 进行 自由 讨论 。 

(2) 其 次 ,除了 项 目 管理 人 员 参 与 的 项 目 计划 评 审 以 及 类 似 的 评审 之 外 ,评审 的 对 象 
文档 更 多 的 是 关于 技术 方面 的 。 作 为 经 理 或 管理 者 ,他 们 一 般 没 有 必要 也 不 一 定理 解 技 
术 文档 的 具体 内 容 。 


2. 主持 人 


主持 人 负责 文档 或 文档 集 的 评审 活动 ,其 主要 的 职责 包括 制定 评审 计划 、 召 开 评 审 
会 议和 跟踪 评审 结果 ,以 及 负责 和 评审 有 关 的 管理 工作 ,确保 评审 有 序 进行 从 而 达到 期 
望 的 目标 。 主 持 人 的 另 一 个 重要 职责 是 收集 评审 数据 和 发 布 评 审 报告 ,用 于 软件 开发 和 
测试 过 程 以 及 评审 过 程 的 改进 。 主 持 人 还 需要 进行 评审 员 不 同 观 点 之 间 的 协调 。 

主持 人 对 评审 的 成 功 至 关 重 要 ,他 们 需要 具备 各 种 相关 的 技能 。 首 先 ,主持 人 必须 
擅长 评审 会 议 的 组 织 和 协调 ,通过 选择 合适 的 策略 引导 会 议 有 效 地 进行 。 其 次 ,主持 人 
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必须 能 够 在 不 打击 参与 者 积极 性 的 情况 下 ,中 止 不 必要 的 讨论 ,以 及 在 评审 员 之 间 存 在 
观点 冲突 的 时 候 进行 调解 ,以 中 立 的 立场 协调 参与 者 之 间 的 讨论 。 最 后 ,他 们 必须 保持 
中 立 ,不 对 评审 对 象 发 表 自 己 的 看 法 。 


3. 作者 


作者 是 提交 评审 的 文档 的 创建 者 。 如 果 多 个 人 参与 文档 的 创建 ,该 文档 的 主要 负责 
人 可 以 指定 为 作者 ,由 他 负责 该 角色 相关 的 职责 和 任务 。 

作者 的 主要 职责 包括 使 评审 对 象 满足 它 的 评审 人 口 准 则 ,例如 确保 文档 处 于 合理 的 
完成 状态 ; 根据 作者 对 文档 内 容 的 理解 和 相关 知识 ,支持 文档 的 评审 ; 作者 需要 负责 文 
档 评审 以 后 的 任何 返工 ,并 且 使 得 评审 对 象 满足 它 的 评审 出 口 准 则 。 

对 作者 而 言 ,重要 的 是 不 把 评审 员 针对 文档 提出 的 问题 ,看 作 是 对 他 个 人 的 批评 。 
作者 必须 明白 评审 的 目的 是 帮助 改进 产品 的 质量 。 


4. 评审 员 


评审 员 一 般 是 指 具 有 专门 技术 或 业务 背景 的 人 员 ,也 称 为 检验 员 (Checker) .审查 员 
(Inspector) ,他 们 在 必要 的 准备 后 ,标识 和 描述 被 评审 对 象 存在 的 问题 (缺陷 )。 他 们 是 
涉及 评审 对 象 内 容 相 关 技术 方面 的 专家 。 评 审 员 应 该 在 评审 过 程 中 代表 不 同 的 观点 。 

评审 员 应 该 识别 评审 对 象 中 存在 的 问题 ,并 对 它们 进行 适当 的 描述 。 他 们 可 以 代表 
不 同 利益 相关 者 的 观点 (例如 项 目 发 起 人 ,需求 分 析 人 员 、 设 计 人 员 、 编 码 人 员 、 安 全 相关 
人 员 ,测试 人 员 等 ) ,但 是 他 们 表达 的 观点 必须 和 评审 对 象 相关 。 

为 了 保证 评审 的 有 效 覆 盖 率 ,有 时 候 需要 给 一 些 评审 员 分 配 特定 的 评审 主题 。 例 如 
有 的 评审 员 可 以 关注 特定 标准 的 一 致 性 ,有 的 关注 语法 ,有 的 关注 整体 的 一 致 性 。 主持 
人 应 该 在 计划 评审 的 时 候 分 配 这 些 角色 。 

评审 员 应 该 为 评审 会 议 做 充分 的 准备 。 在 评审 对 象 描述 不 充分 的 地 方 和 可 能 错误 
的 地 方 做 上 相应 的 标记 ,并 以 作者 能 够 修正 的 方式 文档 化 。 


5. 记录 员 

记录 员 记 录 所 有 在 评审 会 议 中 提出 的 不 足 、 问 题 (包括 采取 的 措施 、 决 定 和 建议 等 )， 
以 及 在 会 议 过 程 中 标识 的 未 解决 的 问题 。 记 录 员 必须 能 够 以 简短 和 准确 的 方式 记录 评 
审 中 发 现 的 问题 , 抓 住 评审 过 程 中 讨论 的 中 心思 想 ,清晰 地 表达 问题 。 

有 时 ,作者 担当 记录 员 这 个 角色 是 比较 合适 的 ,因为 作者 能 够 较 容易 地 理解 评审 员 
提供 的 信息 ,同时 清楚 以 什么 样 的 准确 度 和 详细 程度 对 评审 员 提供 的 意见 和 建议 进行 
记录 。 


3.2.3 评审 类 型 


评审 的 类 型 是 多 样 化 的 ,不 同 的 文档 或 者 代码 有 时 候 需 要 经 历 不 同 的 评审 类 型 ， 


此 ,对 同一 个 评审 对 象 需要 在 不 同 的 时 间 采 用 不 同 的 评审 类 型 。 例 如 ,技术 评审 之 前 首 
先进 行 非 正式 评审 ,在 走 查 之 前 可 能 要 进行 需求 说 明 审 查 。 评 审 的 对 象 既 可 以 是 项 目的 
工作 产品 ,也 可 以 是 项 目 当 前 的 状态 ,评审 员 在 技术 、 成 本 、 进 度 等 方面 对 项 目的 状态 进 
行 评估 。 

评审 的 类 型 主要 包括 非 正 式 评审 (Informal Review) 、 走 查 (Walkthrough) ,技术 评审 
(Technical Review) ,审查 (Inspection) 。 


1. 非 正 式 评 审 


非 正式 评审 是 评审 的 精简 版 , 它 以 一 种 简单 的 方式 遵循 评审 的 通用 过 程 。 通 常情 况 
下 ,文档 作者 发 起 非 正式 评审 。 评 审计 划 局 限 在 选择 评审 员 和 要 求 他 们 在 规定 时 间 内 提 
交 他 们 的 意见 和 建议 。 非 正式 评审 通常 不 召开 评审 会 议 , 也 不 在 评审 员 之 间 交 换 各 自发 
现 的 问题 。 在 这 种 情况 下 ,评审 只 是 作者 和 评审 员 之 间 的 交互 。 评 审 的 结果 不 需要 明确 
的 文档 化 ,有 时 一 个 评审 清单 或 修订 文档 就 足够 了 。 

非 正式 评审 是 一 种 由 一 个 或 多 个 同行 完成 的 交叉 阅读 ,结对 编程 .结对 测试 ,代码 交 
换 以 及 类 似 的 工作 形式 都 可 以 认为 是 非 正式 评审 的 一 种 。 非 正式 评审 非常 普遍 ,并 且 由 
于 工作 量 小 和 简单 方便 而 被 广泛 接收 。 

非 正 式 评审 的 主要 特点 如 下 。 

(1) 没有 正式 的 过 程 。 

(2) 可 以 由 程序 员 的 同行 们 或 技术 负责 人 对 设计 和 代码 进行 评审 。 

(3) 评审 结果 可 以 文档 化 。 

(4) 评审 者 不 同 , 评 审 作 用 可 能 会 不 同 。 

(5) 其 主要 目的 是 以 较 低 的 成 本 获得 收益 。 


2. 走 查 


在 测试 实践 中 , 走 查 既 可 能 是 非常 正式 的 评审 活动 ,也 可 能 是 非常 不 正式 的 评审 活 
动 。 走 查 的 主要 目的 是 发 现 文档 中 的 错误 ,改进 产品 质量 、 考 虑 替换 的 实现 方案 以 及 评 
估 文 档 内 容 和 标准 规格 之 间 的 符合 程度 ,也 可 以 是 相互 学 习 、 增 加 理解 的 一 个 过 程 。 

走 查 的 关注 点 是 召开 评审 会 议 ( 没 有 时 间 限 制 )。 相 对 于 其 他 类 型 的 评审 , 走 查 的 准 
备 时 间 是 最 少 的 ,有 时 甚至 可 以 省 略 。 在 走 查 会 议 上 ,作者 向 评审 员 介 绍 或 演示 文档 内 
容 或 者 产品 ,例如 根据 软件 处 理事 件 的 顺序 ,以 检查 典型 的 用 例 , 有 时 候 也 称 为 场景 ,也 
可 以 模拟 单个 的 用 户 使 用 场景 。 评 审 员 通过 自发 的 提问 来 发 现 可 能 的 缺陷 。 

走 查 的 过 程 适合 5 一 10 人 的 小 型 开发 和 测试 团队 ,因为 准备 工作 和 后 续 工 作 不 需要 
占用 很 多 资源 ,因此 成 本 较 低 。 走 查 可 以 用 来 检查 那些 重要 性 较 低 的 文档 。 

由 于 作者 主导 评审 会 议 . 因 此 他 对 走 查 过 程 有 最 大 的 影响 力 , 例 如 可 以 决定 会 议 讨 
论 的 重点 。 同 时 作者 负责 走 查 后 续 的 跟踪 ,对 于 走 查 的 后 续 活动 ,没有 要 求 更 进一步 的 
检查 。 
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以 下 方法 也 可 用 于 走 查 : 会 议 前 评审 员 提前 准备 ,评审 结果 写 和 会 议 纪要 , 列 出 所 有 
的 发 现 而 不 是 让 作者 标记 它们 。 实 际 上 ,从 非 正 式 到 正式 走 查 有 很 多 变种 。 

走 查 的 主要 特点 如 下 。 

(1) 由 作者 召集 开会 。 

(2) 以 情景 .演示 的 形式 开展 走 查 活动 ,并 且 以 同行 参加 的 方式 进行 。 

(3) 开放 式 模 式 。 

(4) 评审 会 议 之 前 的 准备 .评审 报告 .发现 的 问题 和 记录 员 ( 不 是 作者 本 人 ) 都 不 是 必 
需 的 。 

(5) 在 实际 情况 中 可 以 是 非常 正式 的 ,也 可 能 是 非 正式 的 。 

(6) 其 主要 目的 是 学 习 、 增 加 理解 发现 缺 陷 。 


3. 技术 评审 


技术 评审 既 可 以 是 正式 的 ,也 可 以 是 非 正式 的 。 技 术 评审 的 对 象 可 以 是 正式 的 说 明 
等 技术 文档 ,其 关注 的 焦点 是 技术 文档 与 其 他 参考 文档 之 间 的 一 致 性 ,例如 需求 说 明 、 标 
准 等 。 参 与 技术 评审 的 评审 员 必 须 是 有 资质 的 技术 专家 。 为 了 避免 项 目 盲点 ,参与 评审 
的 一 些 评审 员 可 以 不 是 项 目的 参与 者 ,管理 层 也 不 需要 参与 。 评 审 员 写 出 他 们 发 现 的 缺 
陷 和 建议 ,并 在 评审 会 议 前 提交 给 主持 人 。 主 持 人 (理想 状态 是 经 过 培训 的 人 员 ) 根 据 他 
们 认为 的 重要 性 为 所 有 意见 和 建议 设置 优先 级 。 评 审 会 议 上 ,只 对 主持 人 选择 出 的 重要 
意见 和 建议 做 相关 的 讨论 。 

技术 评审 的 大 部 分 工作 集中 在 准备 工作 阶段 。 在 评审 会 议 上 ,记录 员 记 录 所 有 的 问 
题 并 准备 评审 结果 的 最 终 文 档 。 评 审结 果 必 须 获 得 所 有 参与 人 员 的 一 臻 通过 并 签名 。 
不 同 的 意见 应 该 记录 在 会 议 纪 要 中 。 对 评审 的 结果 做 出 决定 不 是 评审 员 的 工作 ,而 是 管 
理 层 的 职责 。 如 果 是 非常 正式 的 技术 评审 ,需要 定义 评审 的 入口 准则 和 出 口 准则 。 

技术 评审 的 主要 特点 如 下 。 

(1) 对 发 现 的 缺陷 需要 进行 文档 化 。 

(2) 需要 同行 和 技术 专家 的 参与 。 

(3) 没有 管理 者 参与 的 同行 评审 。 

(4) 理想 情况 下 由 专门 接受 过 培训 的 主持 人 (不 是 作者 本 人 ) 来 主持 。 

(5) 会 议 之 前 需要 进行 准备 。 

(6) 可 以 使 用 检查 表 .评审 报告 发现 的 问题 列表 等 。 

(7) 在 实际 情况 中 可 以 是 非常 正式 的 ,也 可 能 是 非 正式 的 。 

(8) 其 主要 目的 是 讨论 .评估 、 发 现 缺陷 ,解决 技术 问题 ,检查 与 规格 及 标准 的 符合 


4. 审查 


审查 是 最 正式 的 评审 , 它 遵 循 正式 严谨 的 评审 过 程 。 通 常 每 个 评审 员 都 是 从 作者 的 


直接 同事 或 同行 中 选 出 的 ,并 且 具 有 固定 的 角色 。 按 照 一 定 的 规则 要 求 定 义 评审 过 程 ， 
针对 审查 的 不 同 对 象 ,使 用 包括 审查 标准 (正式 的 入 口 准则 和 出 口 准则 ) 在 内 的 检查 表 。 

审查 的 重点 是 发 现 文档 的 不 清晰 要 点 和 可 能 的 缺陷 、 度 量 文档 质量 、 改 进 产 品质 量 
和 开发 以 及 测试 过 程 。 审 查 计划 阶段 ,需要 确定 审查 的 目的 ,并 且 只 对 文档 的 特定 部 分 
进行 检查 。 审 查 开始 之 前 ,根据 正式 入 口 准 则 检查 审查 对 象 ,以 确定 是 否 可 以 开始 审查 
活动 。 审 查 员 (在 审查 过 程 中 的 评审 员 也 可 称 作 审查 员 ) 采 用 过 程 、 标 准 和 检查 表 等 手段 
来 准备 审查 内 容 。 

审查 会 议 遵循 下 面 的 议程 。 

主持 人 主持 会 议 。 主 持 人 首先 介绍 参加 人 员 和 他 们 的 角色 ,同时 简单 介绍 需要 检查 
的 对 象 。 主 持 人 询问 每 个 参与 者 是 否 准备 充分 ,可 以 询问 评审 员 用 了 多 少时 间 以 及 发 现 
了 多 少 问题 ,来 检查 每 个 人 是 否 为 这 次 会 议 做 了 充分 的 准备 。 然 后 讨论 文档 格式 的 问 
题 ,并 写 入 会 议 纪要 。 

其 中 的 一 个 评审 员 用 简单 的 、 合 理 的 方式 来 介绍 审查 对 象 的 内 容 , 也 可 以 大 声 地 朗 
读 文 档 。 在 介绍 文档 的 过 程 中 ,评审 员 开始 提问 ,并 对 选择 的 审查 内 容 进 行 仔细 地 检查 。 
作者 回答 相关 的 问题 ,但 是 这 个 过 程 通 常 是 被 动 的 。 如 果 作 者 和 评审 员 对 某 个 有 疑问 的 
意见 不 一 致 ,可 以 在 会 议 的 最 后 继续 进行 讨论 。 

主持 人 必须 在 讨论 失控 的 时 候 进行 干预 ,还 要 保证 评审 会 议 覆 盖 了 所 有 需要 评审 的 
内 容 以 及 整个 文档 。 同 时 主持 人 还 要 保证 记录 员 记 录 了 所 有 的 问题 和 疑问 ,并 且 进行 
跟踪 。 

在 会 议 的 最 后 ,需要 检查 评审 过 程 中 发 现 的 所 有 问题 ,以 保证 记录 的 完整 性 。 对 有 
争论 的 问题 需要 重新 进行 讨论 ,以 决定 它们 是 否 是 缺陷 。 如 果 依旧 没有 解决 ,需要 将 争 
论 的 观点 写 人 会 议 纪要 。 

最 后 ,根据 评审 过 程 中 发 现 的 问题 和 建议 ,确定 审查 对 象 是 评审 通过 ,还 是 需要 返 
工 。 在 审查 完成 后 ,需要 管理 后 续 的 跟踪 工作 和 重新 审查 工作 。 

审查 过 程 中 还 有 一 个 重要 的 工作 , 即 收集 数据 对 开发 和 测试 过 程 和 审查 过 程 进 行 质 
量 评估 。 审 查 工作 除了 可 以 评估 被 审查 文档 的 质量 外 ,还 适用 于 开发 过 程 和 测试 过 程 的 
改进 。 通 过 分 析 收 集 到 的 数据 ,可 以 发 现 开发 过 程 和 测试 过 程 中 存在 的 弱点 。 过 程 改进 
后 ,通过 把 以 前 的 数据 和 当前 的 数据 做 比较 以 检查 过 程 改进 的 有 效 性 。 

审查 的 主要 特点 如 下 。 

(1) 由 专门 接受 过 培训 的 主持 人 (不 是 作者 本 人 ) 来 主持 。 

(2) 通常 是 同行 检查 。 

(3) 定义 了 不 同 的 角色 。 

(4) 引入 了 度量 。 

(5) 根据 和 人口 准则 出口 准则 和 检查 表 定 义 正 式 的 评审 过 程 。 

(6) 会 议 之 前 需要 进行 准备 。 

(7) 需要 审查 报告 和 发 现 问题 列表 。 
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(8) 有 正式 的 跟踪 过 程 。 
(9) 可 以 进行 过 程 改 进 。 
(10) 其 主要 目的 是 发 现 缺 陷 。 


3.2.4 评审 成 功 的 因素 


评审 类 型 的 选择 很 大 程度 上 取决 于 对 评审 以 及 评审 对 象 质量 的 要 求 , 以 及 需要 花费 
的 工作 量 , 同 时 也 取决 于 项 目 环境 。 评 审 类 型 的 选择 ,会 受到 各 种 因素 的 影响 ,例如 : 

(1) 评审 结果 的 形式 。 例 如 ,是 否 需 要 具体 的 评审 结果 文档 ,或 者 只 需要 非 正式 的 评 
审结 果 。 

(2) 是 否 能 找到 5 一 7 个 技术 专家 都 合适 的 评审 时 间 ? 

(3) 是 否 需 要 有 不 同 领 域 的 技术 知识 ? 

(4) 需要 多 少 有 资质 的 评审 员 参 与 ? 

(5) 评审 的 收益 (期 望 结果 ) 和 投入 评审 的 工作 量 是 否 相 一 致 ,或 者 说 是 否 值得 ? 

(6) 评审 对 象 是 否 具有 正式 的 记录 格式 ? 是 否 可 以 通过 工具 支持 来 开展 分 析 活 动 ? 

(7) 管理 层 是 否 支 持 评审 活动 ? 项 目 面临 进度 压力 的 时 候 , 管 理 层 是 否 会 缩减 评审 
时 间 和 工作 量 ? 

根据 组 织 和 项 目的 特殊 要 求 ,可 以 对 评审 类 型 进行 相应 的 裁剪 ,以 提高 评审 的 效率 。 
另外 ,参与 项 目的 不 同人 员 之 间 的 协同 合作 有 利于 项 目 质 量 的 提高 ,因此 项 目 团队 相互 
检查 各 个 阶段 输出 的 工作 产品 ,就 可 以 在 早期 发 现 一 些 缺 陷 和 含糊 不 清 的 地 方 ,例如 极 
限 编程 中 建议 的 结对 编程 ,可 以 认为 是 两 个 人 进行 评审 的 一 种 固定 模式 。 假 如 项 目 是 分 
布 式 开发 的 ,组 织 评审 就 会 比较 困难 ,此 时 需要 采用 其 他 的 一 些 手 段 支持 评审 ,例如 网 络 
评审 ,视频 评审 .电话 会 议 等 。 

成 功 开展 评审 ,会 受到 各 种 因素 的 影响 ,例如 : 

(1) 为 每 次 的 评审 预先 确定 评审 目标 。 评 审 的 目的 可 以 是 发 现 评审 对 象 中 的 缺陷 ， 
提高 评审 对 象 的 质量 ,也 可 以 是 相互 学 习 和 交流 、 决 策 和 评估 候选 方案 等 。 

(2) 针对 评审 目标 ,有 合适 的 评审 人 员 的 参与 。 选 择 合适 的 评审 员 是 评审 成 功 的 关 
键 ,要 选择 具有 一 定 资质 的 人 员 参 与 ,避免 让 领导 或 管理 人 员 在 不 必要 的 情况 下 参与 
评审 。 

(3) 对 发 现 的 缺陷 持 欢迎 态度 ,并 客观 地 描述 缺陷 。 对 作者 来 说 ,应 该 把 评审 当 作 一 
次 学 习 交 流 的 机 会 ,对 意见 和 建议 持 欢迎 的 态度 。 对 评审 员 来 说 ,应 该 对 事 不 对 人 ,并 能 
客观 .中 性 地 发 表意 见 和 建议 。 

(4) 能 够 正确 处 理 人 员 之 间 的 问题 以 及 心理 方面 的 问题 (例如 对 作者 而 言 ,能 让 他 觉 
得 有 积极 正面 的 体验 ) 。 

(5) 采用 的 评审 技术 适合 于 软件 工作 产品 的 类 型 和 级 别 以 及 参与 的 评审 人 员 。 

(6) 选用 合适 的 检查 表 或 定义 合适 的 角色 ,可 以 提高 评审 过 程 中 发 现 问题 的 效率 。 


(7) 提供 评审 技术 方面 的 培训 ,特别 是 针对 正式 的 评审 技术 ,例如 审查 。 

(8) 管理 层 对 良好 评审 过 程 的 支持 (例如 在 项 目 计划 中 安排 足够 的 时 间 来 进行 评审 
活动 ) 。 

(9) 强调 学 习 和 过 程 的 改进 。 不 断 从 评审 过 程 本 身 来 学 习 经 验 教训 ,例如 评审 过 程 
的 持续 改进 等 。 


6.3 静态 分 析 与 工具 支持 


静态 分 析 指 的 是 不 需要 运行 程序 代码 ,借助 工具 对 测试 对 象 进行 检查 的 技术 。 而 动 
态 测试 需要 真正 运行 软件 的 代码 。 静 态 分 析 可 以 发 现在 动态 测试 中 很 难 发 现 的 问题 。 
与 评审 一 样 ,静态 分 析 通 常 发 现 的 是 软件 的 缺陷 而 不 是 软件 运行 的 失效 。 静 态 分 析 工 具 
能 够 分 析 程 序 代码 (例如 控制 流 和 数据 流 ), 同 时 产生 HTML 和 XML 等 格式 的 信息 
输出 。 

和 评审 一 样 ,静态 分 析 的 目的 是 发 现 文档 或 者 代码 中 的 缺陷 或 者 可 能 存在 的 缺陷 隐 
患 。 不 同 的 是 ,静态 分 析 一 般 需要 工具 的 支持 。 例 如 ,拼写 检查 工具 可 以 认为 是 静态 分 
析 的 一 种 形式 , 它 可 以 发 现 文档 中 的 拼写 错误 ,从 而 有 利于 文档 质量 的 提高 。 静 态 分 析 
的 另外 一 个 目的 是 得 到 度量 数据 ,从 而 对 测试 对 象 的 质量 和 复杂 度 进 行 度 量 和 验证 。 

在 使 用 工具 对 文档 进行 分 析 和 检查 时 ,被 分 析 的 文档 必须 以 特定 的 结构 和 标准 来 组 
织 。 静 态 分析 的 对 象 可 以 是 各 种 类 型 的 正式 文档 ,例如 代码 、 技 术 文 档 、 需 求 文 档 、 软 件 
架构 或 者 软件 设计 、UML 中 的 类 型 图 模型 等 。HTML 和 XML 格式 产生 的 输出 也 可 以 
通过 工具 支持 来 进行 分 析 。 也 可 以 对 设计 阶段 开发 的 正式 模型 进行 分 析 , 找 到 其 中 的 不 
一 致 。 目 前 ,程序 代码 是 软件 开发 过 程 中 常见 的 可 以 进行 静态 分 析 的 文档 。 

在 组 件 测试 或 集成 测试 过 程 中 ,开发 人 员 通 常会 使 用 静态 分 析 工 具 , 检 查 被 测 对 象 
是 否 满足 编程 指南 或 编程 规范 。 集 成 测试 过 程 中 ,需要 分 析 测 试 对 象 是 否 满足 接口 
说 明 。 

静态 分 析 和 评审 是 紧密 联系 的 。 若 在 评审 之 前 进行 了 静态 分 析 , 可 以 发 现 很 多 的 缺 
陷 或 异常 , 则 可 以 显著 提高 评审 效率 。 由 于 静态 分 析 通 常 是 工具 支持 的 ,因此 其 工作 量 
会 比 评审 少 得 多 。 

(1) 假如 对 象 是 正规 的 文档 ,可 以 使 用 工具 支持 的 静态 分 析 , 只 要 花费 很 少 的 成 本 就 
可 以 发 现 一 些 错误 和 不 一 致 处 ,从 而 可 以 缩短 评审 的 时 间 。 

(2) 通常 ,即使 没有 计划 评审 活动 ,静态 分 析 也 是 应 该 经 常 使 用 的 。 通 过 静态 分 析 发 
现 和 移 除 缺陷 或 异常 ,可 以 提高 文档 的 质量 。 

并 不 是 所 有 的 缺陷 都 可 以 通过 静态 分 析 来 发 现 . 有 些 缺 陷 只 有 在 程序 运行 的 时 候 才 
能 显现 出 来 , 即 这 些 缺 陷 只 有 通过 运行 时 才 会 转变 成 失效 并 被 发 现 。 例 如 ,除法 中 的 分 
母 是 一 个 变量 ,给 这 个 变量 的 赋值 为 0 时 ,运行 程序 就 会 出 现 问题 。 通 过 静态 分 析 ,发 现 
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这 种 类 型 的 缺陷 并 不 容易 ,除非 常量 0 赋 给 了 这 个 变量 。 另 外 一 种 方式 是 分 析 所 有 可 能 
的 路 径 来 解决 这 个 问题 ,但 这 种 情况 可 能 会 出 现 潜在 的 风险 : 项 目的 延期 。 

另外 ,动态 测试 也 不 容易 发 现 程序 中 的 一 些 不 一 致 和 可 能 存在 问题 的 区 域 。 例 如 ， 
测试 对 象 和 编程 标准 的 差异 .禁止 使 用 具有 错误 倾向 的 程序 结构 等 类 型 的 缺陷 ,它们 更 
容易 通过 静态 分 析 ( 或 评审 ) 发 现 。 

所 有 的 编译 器 都 会 对 程序 代码 进行 静态 分 析 , 用 来 确认 程序 代码 是 否 使 用 了 编程 语 
言 的 正确 的 语法 。 除 了 编译 器 外 ,还 有 称 为 分 析 器 的 工具 ,用 它们 对 单个 软件 组 件 或 集 
成 系统 进行 分 析 。 

用 静态 分 析 工 具 可 以 发 现 程序 中 的 如 下 问题 。 

(1) 引用 一 个 没有 定义 值 的 变量 。 

(2) 模块 和 组 件 之 间 的 接口 不 一 致 。 

(3) 从 未 使 用 的 变量 。 

(4) 不 可 达 代 码 或 死 代 码 。 

(5) 逻辑 上 的 遗漏 与 错误 (潜在 的 无 限 循环 ) 。 

(6) 过 于 复杂 的 结构 。 

(7) 违背 编程 规则 。 

(8) 安全 漏洞 。 

(9) 代码 和 软件 模型 的 语法 错误 。 

静态 分 析 可 以 用 来 发 现 安全 性 问题 。 很 多 安全 性 漏洞 是 由 于 使 用 了 错误 倾向 的 程 
序 结构 ,并且 没有 进行 必要 的 检查 而 发 生 的 。 例 如 缺少 缓冲 区 溢出 保护 ,或 者 没有 检查 
输入 数据 越界 等 问题 。 静 态 分 析 工具 可 以 发 现 这 种 类 型 的 缺陷 ,因为 它们 有 标准 的 格式 
来 查找 和 发 现 这 种 缺陷 。 

静态 分 析 的 优点 如 下 。 

(1) 在 测试 执行 之 前 尽早 发 现 缺 陷 和 问题 。 

(2) 通过 度量 的 计算 (例如 高 复杂 性 测量 ) ,早期 警惕 可 能 存 有 问题 的 代码 和 设计 (高 
风险 区 域 ) 。 

(3) 可 以 发 现在 动态 测试 过 程 中 不 容易 发 现 的 一 些 缺 陷 和 异常 。 

(4) 可 以 发 现 软件 组 件 之 间 的 相互 关联 的 不 一 致 性 。 

(5) 可 以 改进 代码 和 设计 ,增强 可 维护 性 。 

开发 人 员 通 常 在 组 件 测试 和 集成 测试 之 前 或 期 间 使 用 静态 分 析 工 具 ( 例 如 检查 预先 
定义 的 规则 或 编程 规范 ) ,而 设计 人 员 在 软件 建 模 期 间 也 会 使 用 静态 分 析 工 具 。 

静态 分 析 工 具 通 常会 产生 大 量 的 警告 和 注释 信息 。 为 了 更 加 有 效 地 使 用 工具 ,产生 
的 大 量 信息 必须 进行 适当 的 处 理 , 例 如 通过 设置 工具 参数 ,按照 一 定 的 顺序 或 规则 控制 
产生 的 信息 ,否则 使 用 这 种 工具 的 效率 无 法 体现 。 编 译 器 也 可 以 为 静态 分 析 提 供 一 些 帮 
助 ,包括 度量 的 计算 等 。 


3.3.1 编译 器 分 析 工 具 


通过 编译 器 分 析 工 具 可 以 发 现 编程 语言 语法 错误 ,并 且 以 错误 或 警告 的 方式 进行 报 
。 很 多 的 编译 器 也 会 产生 其 他 的 信息 ,并 且 执行 其 他 的 检查 。 例 如 

(1) 产生 不 同 程序 元 素 的 交叉 引用 列表 (例如 变量 、 函 数 )。 

(2) 检查 编程 语言 中 数据 和 变量 的 类 型 是 否 一 致 。 

(3) 检查 没有 定义 的 变量 。 

(4) 检查 不 可 达 代码 。 

(5) 检查 域 边界 的 上 限 或 下 限 (静态 选择 )。 

(6) 检查 接口 的 一 致 性 。 

(7) 检查 所 有 作为 跳 转 开始 或 跳 转 结束 标签 的 使 用 。 

这 些 信息 通 常 提供 在 一 个 列表 中 。 工 具 中 报告 的 “疑似 ”结果 通常 是 可 能 的 缺陷 隐 
患 ,因此 ,需要 更 进一步 的 分 析 。 
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3.3.2 规范 标准 一 致 性 


通过 静态 分 析 工 具 还 可 以 检查 测试 对 象 是 否 与 规范 、 标 准 相 一 致 ,例如 是 否 遵循 了 
编程 规范 和 标准 。 这 种 检查 方式 几乎 不 需要 花费 多 少时 间 和 人 力 成 本 。 另 外 ,通过 静态 
分 析 工 具 检 查 还 有 一 个 优点 : 假如 编程 人 员 知 道 代 码 需 要 和 编程 规范 进行 一 致 性 检查 ， 
他 们 会 更 乐于 按照 编程 规范 来 工作 。 


3.3.3 ”数据 流 分 析 


数据 流 分 析 通 过 检查 程序 代码 中 的 数据 流 来 发 现 数据 流 异常 。 需 要 注意 的 是 数据 
流 分 析 通 常 发 现 的 是 数据 流 异常 ,不 一 定 是 缺陷 。 异 常 指 的 是 由 于 不 一 致 而 可 能 导致 的 
失效 ,也 可 能 是 代码 的 元 余 。 异 常 是 一 种 风险 ,可 能 会 触发 系统 的 失效 。 

数据 流 异常 有 各 种 表现 形式 ,例如 变量 没有 赋值 之 前 ,就 对 该 变量 进行 读 取 操 作 ; 或 
者 变量 赋值 之 后 ,但 在 程序 中 根本 没有 使 用 或 读 取 该 变量 。 在 数据 流 分 析 过 程 中 ,检查 
每 个 变量 的 使 用 情况 ,并 且 根 据 每 个 变量 的 使 用 情况 定义 了 三 种 不 同 的 变量 状态 。 

(1) 已 定义 (D-Defined) : 变量 已 经 赋值 ,表示 此 变量 有 确定 的 值 。 

(2) 被 引用 (R-Referenced) : 读 取 或 使 用 变量 的 值 , 表 示 此 变量 的 值 被 使 用 了 。 

(3) 未 定义 (U-Undefined) : 命名 了 变量 ,但 还 没有 对 变量 赋值 ,或 已 经 释放 了 变量 
(模块 或 函数 结束 时 ) ,此 时 的 变量 没有 确定 的 值 。 

跟踪 每 一 个 变量 ,通过 分 析 变 量 的 状态 变化 情况 发 现 问 题 或 异常 ,这 里 存在 三 种 数 
据 流 异常 的 情况 , 即 如 果 某 个 变量 的 先后 状态 连续 出 现 UR、RU 或 DD。 


NA 
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(1) UR- 异 常 : 程序 路 径 上 的 某 个 变量 的 状态 从 U( 未 定义 ) 转 化 到 R( 被 引用 ) ,表示 
读 取 了 没有 赋值 的 变量 或 已 经 释放 的 变量 。 

(2) DU- 异 常 : 某 个 变量 的 状态 从 D( 已 定义 ) 转 化 到 U( 未 定义 ), 表 示 变 量 已 经 赋 
值 ,但 该 变量 未 曾 使 用 就 已 经 是 无 效 了 ,因为 此 变量 又 被 重新 命名 了 ,原先 的 值 已 不 复 
存在 。 

(3) DD- 异 常 : 某 个 变量 的 状态 从 D( 已 定义 ) 转 化 到 D( 已 定义 ) ,表示 变量 被 连续 赋 
值 了 两 次 ,在 前 一 次 赋值 还 没 被 使 用 的 情况 下 又 赋 了 第 二 个 值 ,同时 第 一 个 赋值 不 复 
存在 。 

下 面 的 例子 中 解释 了 不 同类 型 的 异常 情况 (以 C++ 语 言 为 例 )。 函 数 的 目的 是 假如 
变量 Min 的 值 大 于 变量 Max 的 值 , 则 通过 变量 Help 的 帮助 ,来 交换 参数 Max 和 Min 的 
整 型 值 。 

void exchange (int& Min，int& Max) { 

int Help; 

if (Min > Max) { 

Max = Help; 
Max = Min; 
Help = Min; 


} 


通过 如 表 3-1 所 示 的 数据 流 分 析 表 可 以 对 例子 中 的 数据 流 进行 分 析 。 
表 3-1 数据 流 分 析 表 


行 号 \ 变 量 Min Max Help 

1 (in) D D 
2 U 
3 R R 
4 D R 
5 R D 
6 R D 
n 

8 (out) U U U 


通过 分 析 变 量 的 使 用 情况 ,可 以 发 现 以 下 异常 。 

(1) 变量 Help 的 UR 异常 : 变量 的 范围 局 限 在 函数 内 。 变 量 的 第 一 次 使 用 是 在 赋 
值 语句 的 右 侧 部 分 (语句 2)。 这 个 时 候 , 变 量 还 没有 赋值 ,而 在 语句 4 进行 了 直接 的 引 
用 。 变 量 声明 的 时 候 没 有 初始 化 (假如 高 级 别 的 警告 打开 ,这 种 异常 也 可 以 通过 常用 的 
编译 器 来 发 现 ) 。 

(2) 变量 Max 的 DD 异常 : 在 赋值 语句 4 和 赋值 语句 5 的 左边 ,Max 变量 连续 使 用 
了 两 次 ,因此 Max 赋值 了 两 次 。 第 一 次 的 赋值 就 被 忽略 ,第 一 次 赋 的 值 在 被 使 用 前 已 被 


第 二 次 赋 的 值 覆盖 了 。 

(3) 变量 Help 的 DU 异常 : 函数 的 最 后 一 个 赋值 (语句 6) ,变量 Help 被 赋 了 一 个 任 
何 地 方 都 不 能 用 的 数值 ,因为 变量 Help 只 有 在 函数 内 是 有 效 的 。 

这 个 例子 中 ,异常 情况 是 明显 的 。 但 是 在 实际 情况 中 问题 可 能 会 更 复杂 ,函数 的 规 
模 也 可 能 会 很 大 。 这 时 候 异常 就 不 会 这 么 明显 ,通过 手动 检查 ,例如 评审 ,容易 遗漏 这 些 
问题 。 而 分 析 数 据 流 的 工具 可 以 发 现 这 些 异常 。 

不 是 每 个 异常 都 会 导致 程序 或 者 软件 的 不 正确 行为 ,成 为 一 个 失效 。 例 如 ,DU- 异 常 
就 不 会 有 直接 的 影响 ,程序 可 以 继续 运行 。 所 以 我 们 应 该 去 分 析 这 些 异常 : 为 什么 这 个 
异常 的 赋值 会 出 现在 程序 的 这 个 特殊 位 置 (语句 6)? 通过 分 析 找 出 引起 这 些 异常 的 根 
源 。 通 常 ,存在 异常 和 问题 的 程序 部 分 ,更 加 需要 进行 检查 以 便 进一步 地 发 现 不 一 致 。 


3.3.4 控制 流 分 析 


假如 将 程序 的 结构 以 控制 流 图 的 方式 表示 ,控制 流 图 中 的 节点 代表 代码 中 的 可 执行 
语句 。 可 以 将 没有 分 支 的 顺序 系列 语句 表示 为 一 个 节点 ,因为 这 一 系列 语句 在 程序 执行 
时 其 控制 流 并 不 会 发 生变 化 。 假 如 执行 这 系列 语句 的 第 一 句 ,系列 内 的 其 他 语句 也 一 定 
会 被 执行 到 。 

程序 执行 中 顺序 可 能 会 发 生变 化 的 地 方 表示 为 分 支 ,分 支 可 以 是 判定 语句 ,也 可 能 
是 循环 语句 。 例 如 判定 语句 IF , 若 判定 计算 的 值 为 TRUE, 则 程序 继续 执行 以 THEN 
开头 的 部 分 。 若 判定 计算 的 值 为 FALSE, 则 程序 执行 ELSE 部 分 。 假 如 是 循环 语句 , 循 
环 会 回 到 前 面 的 语句 ,所 以 会 重复 执行 控制 流 中 的 部 分 语句 。 

通过 控制 流 图 的 清楚 描述 ,可 以 很 容易 理解 程序 结构 ,同时 可 以 发 现 一 些 异 常 ,例如 
是 否 会 异常 跳出 循环 体 ,或 者 有 几 个 出 口 的 程序 结构 等 。 这 些 异常 并 不 一 定 会 导致 失 
效 ,但 它们 不 符合 结构 化 编程 的 原则 。 在 实际 应 用 过 程 中 ,通过 手工 方式 生成 控制 流 图 
是 很 困难 的 ,因此 需要 有 相应 工具 的 支持 。 

假如 控制 流 图 的 部 分 或 者 整体 非常 复杂 .它们 之 间 的 相互 关系 和 事件 顺序 难以 理 
解 ,这 时 候 就 需要 修正 程序 的 架构 和 内 容 , 因 为 复杂 的 程序 结构 常常 意味 着 潜在 的 错误 
风险 。 而 圈 复 杂 度 静态 分 析 工 具 可 以 分 析 代 码 的 复杂 程度 。 


3.3.5 圈 复 杂 度 


静态 分 析 工 具 除 了 上 面 提 到 的 静态 分 析 能 力 外 ,还 可 以 提供 度量 值 。 软 件 系 统 的 质 
量 特性 可 以 通过 度量 值 进行 度量 。 通 过 检查 度量 值 , 确 认 它 们 是 否 满足 特殊 的 需求 。 

定义 软件 特殊 属性 度量 的 目的 是 获得 抽象 软件 的 定量 测量 。 因 此 ,度量 只 能 对 经 过 
检查 的 软件 部 分 提供 判断 ,并 且 计 算得 到 的 测量 值 ,需要 和 经 过 检查 的 其 他 程序 或 程序 
模块 之 间 比 较 ,这样 才 有 意义 。 
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圈 数 可 以 用 来 测量 程序 代码 结构 的 复杂 度 ,所 以 也 称 作 圈 复 杂 度 ,如 图 3-1 所 示 。 


图 3-1 圈 数 计算 的 控制 流 图 


对 于 程序 或 程序 模块 的 控制 流 图 G, 它 的 圈 复 杂 度 ( 圈 数 ) 可 以 通过 下 面 的 公式 计算 

得 到 : 
V(G) 一 e 一 ?2 十 2 

其 中 : 

v(G) 为 控制 流 图 G 的 圈 数 ， 

e 为 控制 流 图 中 的 边 数 ; 

2 为 控制 流 图 的 节点 数 。 

图 3-1 表示 了 程序 模块 的 控制 流 , 它 是 可 以 被 调用 的 函数 。 圈 数 的 计算 式 如 下 。 

v(G)=e—n++2= 17—13+2=6 


其 中 : 

e 为 控制 流 图 的 边 数 = 17 

nn 为 控制 流 图 的 节点 数 二 13 

计算 得 到 的 圈 数 为 6, 根 据 McCable 原则 ,这 个 数值 属于 可 以 接受 的 中 间 范 围 。 
McCable 原则 一 般 认为 圈 数 大 于 10 是 不 可 接受 的 , 若 圈 数 大 于 10 则 建议 需要 对 程序 代 
码 进行 重新 设计 。 通 过 圈 数 可 以 获得 不 同 组 件 / 模 块 的 相对 复杂 度 , 有 效 地 安排 资源 ,并 
确定 测试 的 广度 和 深度 。 例 如 假如 某 个 组 件 的 圈 数 较 大 ,说 明 此 组 件 相 对 比较 复杂 、 风 
险 也 较 大 ,可 能 会 考虑 对 此 组 件 进 行 更 深入 的 测试 ,花费 更 多 的 资源 。 

圈 数 也 代表 了 程序 模块 的 控制 流 图 中 独立 路 径 的 数目 ,这 组 独立 路 径 代表 了 控制 流 
图 中 的 所 有 特征 ,而 其 他 的 非 独立 路 径 都 可 以 通过 这 组 独立 路 径 运 算得 出 。 因 此 圈 数 可 
以 用 来 估算 程序 代码 的 可 测试 性 和 可 维护 性 。 为 了 有 效 地 测试 控制 流 图 中 的 所 有 特征 ， 
则 至 少 需要 覆盖 所 有 的 独立 路 径 .因此 圈 数 提供 了 关于 测试 用 例 数目 的 重要 信息 。 维 护 
代码 最 基本 的 要 求 是 了 解 程序 。 程 序 圈 数 越 大 ,理解 程序 模块 的 难度 越 大 。 

圈 数 的 一 个 缺点 是 没有 考虑 用 来 选择 控制 流 的 条 件 复杂 性 。 不 管 条 件 是 由 多 个 原 
子 条 件 通过 逻辑 运算 符 连 接 而 成 的 复合 条 件 ,. 还 是 单个 条 件 , 都 不 会 影响 圈 数 的 计算 。 


更 多 关于 圈 的 知识 请 参见 相关 资料 。 


@.4 习题 


(K1) 关 于 静态 分 析 的 描述 ,下 列 选项 正确 的 是 ( ) 。 

. 开发 人 员 通 常 在 软件 验收 期 间 使 用 静态 分 析 工 具 

静态 分 析 不 需要 运行 被 测 软件 , 且 能 发 现 软件 的 失效 

. 通过 静态 分 析 能 够 发 现 模块 和 组 件 之 间 的 接口 不 一 致 

.通过 静态 分 析 能 够 发 现 软件 内 的 所 有 缺陷 

(K1) 下 面 不 属于 软件 评审 的 好 处 的 是 ( ) 。 

. 增加 测试 的 时 间 

. 尽早 发 现 和 修改 缺陷 

. 改善 开发 能 力 、 缩 短 开 发 时 间 

.缩减 测试 成 本 

(K1) “向 评审 员 解 释 评审 的 目标 ”属于 下 列 哪个 阶段 的 主要 活动 ? 〈 ) 

. 计划 阶段 

. 预备 会 阶段 

. 个 人 准备 阶段 

.评审 会 议 阶段 

(K2) 在 评审 过 程 中 ,主持 人 的 主要 职责 是 ( 由 

. 决定 是 否 需要 进行 评审 

.主持 文档 或 文档 集 的 评审 活动 

.标识 和 描述 被 评审 产品 存在 的 问题 (如 缺陷 ) 

. 记录 所 有 的 事件 .问题 

(K1) 参 与 正式 评审 的 所 有 角色 包括 哪些 ? ( ) 

. 作者 .评审 员 、 记 录 员 

经 理 , 作 者 、 主 持 人 ,评审 员 、 记 录 员 

. 经 理 、 主 持 人 、 作 者 、 记 录 员 

主持 人 ,作者 ,评审 员 

(K1) 下 面 哪个 活动 是 属于 主持 人 的 主要 职责 ? ( ) 

. 决定 哪些 文档 需要 进行 评审 

.主持 文档 或 者 文档 集 的 评审 活动 ,包括 制订 评审 计划 、 召 开会 议和 会 议 后 对 结果 
的 跟踪 

. 负责 文档 的 修改 

D. 记录 评审 会 议 中 的 各 种 事件 和 问题 


= NPP Np Np PN r= MIN 


全 


NA 
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(K1) 下 面 哪个 缺陷 是 静态 分 析 工 具 容 易 发 现 的 问题 (  ) 
代码 实现 和 设计 要 求 不 吻合 

软件 的 可 维护 性 差 

引用 了 某 个 没有 定义 的 变量 

内 存 泄 漏 

(K2) 下 面 关 于 评审 的 作用 ,说 法 正确 的 是 (  )。 


.评审 能 够 发 现 缺 陷 ,缩短 开发 时 间 
. 评审 应 该 尽早 开展 ,可 以 减少 动态 测试 的 成 本 


静态 测试 和 动态 测试 是 互补 的 ,有 些 问题 要 到 动态 测试 的 时 候 才 能 发 现 
评审 员 需 要 清晰 地 标注 评审 问题 和 结果 ,以 帮助 作者 改进 文档 质量 
asb 

ay，c 

a, b,c 

a,b,c,d 


学 习 目标 


LO-4. 1. 
LO-4. 1. 
LO-4. 
LO-4. 1. 


LO-4. 2. 


LO-4,2. 


LO-4. 3. 


LO-4. 3. 


LO-4. 


LO-4. 


LO-4. 


LO-4. 


LO-4. 
LO-4. 


LO-4. 
LO-4. 


Vi. ss 


> 


La 


学 习 目 标 描述 
明确 测试 设计 说 明 ,测试 用 例 说 明和 测试 规程 说 明 的 区 别 
比较 术语 : 测试 条 件 、 测 试用 例 和 测试 规程 
对 测试 用 例 本 身 的 质量 可 以 从 与 需求 的 可 追溯 性 以 及 期 望 结果 
这 两 方面 来 评价 
根据 测试 人 员 的 理解 水 平 ,将 测试 用 例 转换 为 不 同 详细 程度 的 
结构 合理 的 测试 规程 说 明 
理解 在 测试 用 例 设计 中 ,为 什么 需要 采用 基于 说 明 的 测试 方法 
( 黑 盒 测试 ) 和 基于 结构 的 测试 方法 ( 白 盒 测试 )? 列举 出 各 自 比 
较 常 用 的 技术 
解释 基于 说 明 的 测试 .基于 结构 的 测试 和 基于 经 验 的 测试 三 者 
的 特征 和 区 别 
使 用 等 价 类 划分 .边界 值 分 析 、 决 策 表 和 状态 转换 图 / 表 对 指定 
的 软件 模型 编写 测试 用 例 
解释 这 4 种 测试 设计 技术 各 自 的 主要 目的 ,这 些 技术 可 以 应 用 
于 什么 测试 级 别 和 测试 类 型 ,以 及 如 何 测量 测试 覆盖 
解释 用 例 测试 的 概念 和 应 用 这 种 技术 的 优点 
描述 代码 覆盖 的 概念 及 其 重要 性 
解释 语句 覆盖 和 判定 覆盖 等 概念 ,理解 这 些 概 念 除 了 可 以 应 用 
在 组 件 测试 外 ,还 可 以 应 用 在 其 他 任何 测试 级 别 上 (例如 系统 级 
别 上 的 业务 过 程 测试 ) 
根据 给 定 的 控制 流 , 使 用 语句 测试 和 判定 测试 设计 技术 编写 测 
试用 例 
根据 已 定义 的 出 口 准 则 评估 语句 覆盖 和 判定 覆盖 的 完整 性 
复述 在 哪些 情况 下 使 用 基于 直觉 .基于 经 验 和 知识 、 基 于 对 常见 
缺陷 的 认识 来 编写 测试 用 例 
比较 基于 经 验 的 方法 和 基于 说 明 的 方法 之 间 的 区 别 
根据 给 定 的 因素 ,例如 测试 依据 、 各 自 的 模型 和 软件 特性 等 , 选 
择 合适 的 测试 设计 技术 
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术语 
术语 含义 解释 
Test Case 对 于 一 个 测试 项 ,用 来 指定 一 组 测试 用 例 (目标 、 输 入 、 
Sevilientioa 本 人 人 全 测试 动作 、 期 望 结果 .执行 预 置 条 件 ) 的 文档 
本 (1) 参见 Test Design Specification 
Tope eb (2) 将 测试 目标 转换 成 具体 的 测试 条 件 和 测试 用 例 的 过 程 
ee 测试 过 程 的 执行 计划 ,这 些 测试 过 程 包含 在 测试 执行 进 
0 测试 执行 进度 表 “| 度 表 中 ,执行 进度 表 列 出 了 执行 任务 间 的 关联 和 执行 的 
Schedule 顺序 
Test Procedure 规定 了 执行 测试 的 一 系列 行为 的 文档 。 也 称 为 测试 脚 
Specification 人 本 或 手工 测试 脚本 
Test Seript 测试 脚本 通常 是 指 测试 规程 说 明 ,尤其 是 自动 化 的 
识别 文档 和 软件 中 相关 联 条 目的 能 力 。 例 如 需求 与 相 
Traceability 可 追溯 性 关 测 试 关联 。 参 见 Horizontal Traceability，Vertical 
Traceability 
Test Design i 为 一 个 测试 项 指定 测试 条 件 (覆盖 项 ) .具体 测试 方法 并 
Sevilleation 和 人 全 网 识别 相关 高 层 测试 用 例 的 文档 
ee 一 个 测试 级 别 的 需求 和 相应 级 别 的 测试 文档 (例如 测试 
lt 水 平 可 追踪 性 计划 、 测 试 设计 说 明 、 测 试用 例 说 明 、 测 试 规程 说 明 或 测 
i 试 脚本 ) 之 间 的 可 追踪 性 
Vertical Traceability | 垂直 可 跟踪 性 贯穿 开发 文档 到 组 件 层次 的 需求 跟踪 
Black-box Test 基于 系统 功能 或 非 功能 说 明 书 来 设计 或 者 选择 测试 用 
Design Technique | 黑金 测试 设计 技术 | 例 的 技术 ,不 涉及 软件 内 部 结构 
Experienced-based 。 | 基于 经 验 的 测试 。 “| 根据 测试 人 员 的 经 验 、 知 识 和 直觉 来 进行 用 例 设计 和 / 
Test Design Technique| 设计 技术 或 选择 的 一 种 技术 
Test Design Technique| 测试 设计 技术 用 来 衍生 和 /或 选择 测试 用 例 的 步 双 
White-box Test a 通过 分 析 组 件 /系统 的 内 部 结构 来 产生 和 /或 选择 测试 
Design Technique 有 生计 区 下 用 例 的 规程 
Boundary Value 一 种 黑 盒 设计 技术 ,基于 边界 值 进行 测试 用 例 的 设计 ， 
Analysis 边界 入 分 析 参见 Boundary Value 
通过 分 析 输入 或 输出 变量 的 边界 或 等 价 划 分 的 边界 来 
Boundry Value 边界 值 设计 测试 用 例 
了 一 种 黑 盒 测试 设计 技术 ,设计 的 测试 用 例 用 来 测试 决策 
Decision Table Testing| 决策 表 测 试 表 中 各 种 条 件 的 组 合 。 参 见 Decision Table 
本 一 个 可 用 来 设计 测试 用 例 的 表格 ,一 般 有 条 件 桩 、 行 动 
Dogon Toble 关 生 于 柱 和 条 件 规则 条 目 和 行动 规则 条 目 组 成 
| 一 种 黑 盒 测试 设计 技术 ,该 技术 从 组 件 的 等 价 类 中 选取 
等 价 类 划分 技术 。 | 典型 的 点 进行 测试 。 原 则 上 每 个 等 价 类 中 至 少 要 选取 


Partitioning 


一 个 典型 的 点 来 设计 测试 用 例 
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续 表 
术 语 会 文 解 释 
State Transition 一 种 黑 盒 测 试 设计 技术 ,所 设计 的 测试 用 例 用 来 执行 
Testing ee 有 效 和 无 效 的 状态 转换 。 参 见 N-switch testing 
一 种 黑 盒 测试 设计 技术 ,所 设计 的 测试 用 例 用 于 执行 
Use Case Testing 用 例 测试 用 例 场景 
一 种 分 析 方 法 ,用 于 确定 软件 的 哪些 部 分 被 测试 套件 
Code Coverage 代码 覆盖 覆盖 到 了 ,哪些 部 分 没有 ,包括 语句 覆盖 ,判定 覆盖 和 
条 件 覆 盖 
二 判定 有 两 个 或 多 个 可 替换 路 径 控制 流 的 一 个 程序 控制 点 ， 
也 是 连接 两 个 或 多 个 分 支 的 节点 


执行 测试 套件 能 够 覆盖 的 判定 结果 的 百分比 。100% 的 
判定 覆盖 意味 着 100% 的 分 支 覆 盖 和 100% 的 语句 覆盖 
在 组 件 中 ,控制 从 任何 语句 到 其 他 任何 非 直 接 后 续 语 
Branch 分 支 句 的 一 个 条 件 转 换 ,或 者 是 一 个 无 条 件 转 换 ,例如 
case， jump，go to，if-then-else 语句 


执行 一 个 测试 套件 所 能 覆盖 的 分 支 的 百分比 。100% 


Decision Coverage 判定 覆盖 


Branch Coverage 分 支 覆盖 的 分 支 覆 盖 是 指 100% 的 判定 条 件 覆盖 和 100% 的 语 
句 覆盖 
编程 语言 的 一 个 实体 ,一 般 是 最 小 的 ,不 可 分 割 的 执 
Statement 语句 i 
行 单元 
Statement Coverage 语句 覆盖 由 测试 套件 运行 的 可 执行 语句 的 百分比 
一 种 非 正式 的 测试 设计 技术 ,测试 人 员 能 动 地 设计 一 
Exploratory Testing “| 探索 性 测试 些 测试 用 例 ,通过 执行 这 些 测 试用 例 和 在 测试 中 得 到 
的 信息 来 设计 新 的 更 好 的 测试 用 例 
Fault Attack 故障 攻击 参见 Attack 
通过 使 测试 对 象 产 生 特定 类 型 的 失效 ,有 组 织 ` 有 目 
Attack 攻击 的 地 评估 其 质量 ,尤其 是 可 靠 性 。 参 见 Negative 


Testing 

一 种 旨 在 表现 组 件 /系统 不 能 正常 工作 的 测试 。 逆 向 
测试 取决 于 测试 人 员 的 想法 ,态度 ,而 与 特定 的 测试 
途径 或 测试 设计 技术 无 关 , 例 如 使 用 无 效 输 入 值 测 试 
或 在 异常 情况 下 进行 测试 


Negative Testing 逆向 测试 


G1 测试 开发 过 程 


测试 开发 过 程 包括 测试 分 析 、 测 试 设计 和 测试 实现 三 个 阶段 ,主要 测试 活动 包括 识 
别 测试 条 件 (Test Conditions)、 开 发 测试 用 例 (Test Cases) 和 定义 测试 规程 (Test 
Procedures)。 根 据 具体 情况 ,测试 开发 过 程 可 以 采用 很 少 甚至 没有 文档 的 非 正 式 方式 ， 
也 可 以 采用 非常 正式 的 方式 。 其 测试 开发 过 程 的 正式 程度 依赖 于 测试 背景 ,包括 组 织 架 
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构 ,测试 及 开发 过 程 的 成 熟 度 、 项 目的 时 间 限制 ,安全 需求 以 及 参与 人 员 的 资质 等 。 

在 测试 分 析 阶 段 ,要 对 测试 基础 文档 , 即 测 试 依据 进行 分 析 , 从 而 决定 测试 什么 ,也 
就 是 明确 测试 条 件 。 测 试 条 件 是 能 通过 一 个 或 多 个 测试 用 例 进行 验证 的 一 个 条 目 或 事 
件 , 例 如 功能 、 事 务 处 理 、 质 量 特征 或 结构 元 素 等 。 

建立 从 测试 条 件 到 需求 的 可 追溯 性 ,有 助 于 需求 变更 时 的 影响 分 析 和 测试 用 例 集 的 
需求 覆盖 率 分 析 。 在 测试 分 析 阶 段 , 还 应 该 考虑 已 经 识别 的 风险 ,基于 这 些 风险 确定 采 
用 的 具体 测试 方法 并 选择 合适 的 测试 技术 。 

在 测试 设计 阶段 ,要 定义 和 记录 测试 用 例 和 测试 数据 。 测 试用 例 由 输入 值 ,执行 的 前 
提 条 件 ,预期 结果 和 执行 的 后 置 条 件 等 元 素 组 成 ,以 覆盖 一 定 的 目标 或 测试 条 件 。 测 试 设 
计 说 明 ( 包 含 测试 条 件 ) 和 测试 用 例 说 明 的 内 容 在 IEEE Std 829 一 1998 中 有 具体 的 描述 。 

预期 结果 应 该 作为 测试 用 例 说 明 的 一 部 分 ,同时 包含 测试 输出 、 数 据 和 状态 的 变化 ， 
以 及 其 他 的 测试 结果 。 假 如 没有 明确 预期 结果 , 则 一 个 看 似 合理 却 错 误 的 结果 可 能 被 视 
为 正确 的 结果 。 理 想 情况 下 应 该 在 测试 执行 之 前 明确 定义 预期 结果 。 

在 测试 实现 阶段 ,其 主要 的 活动 包括 (实际 ) 测 试用 例 的 开发 与 实现 ,测试 套件 (Test 
Suite) 的 组 织 和 优先 级 确定 ,这 些 工作 的 结果 应 该 包含 在 测试 规程 说 明 中 。 测 试 规程 说 
明 ( 或 者 手工 测试 脚本 ) 描 述 了 测试 用 例 执行 的 顺序 。 如 果 使 用 测试 执行 工具 进行 测试 ， 
则 在 自动 化 测试 脚本 中 体现 了 这 种 测试 的 动作 顺序 (自动 化 的 测试 规程 ) 。 

测试 执行 进度 表 中 体现 了 不 同 的 测试 规程 和 自动 化 测试 脚本 ,并 定义 了 自动 化 测试 
脚本 的 执行 顺序 .执行 的 时 间 和 执行 者 。 测 试 执行 进度 表 同 时 还 需要 考虑 其 他 因素 , 例 
如 回归 测试 ,测试 优先 级 以 及 测试 活动 之 间 的 依赖 关系 等 。 


@.2 测试 设计 技术 的 种 类 


使 用 测试 设计 技术 的 目的 是 识别 测试 条 件 和 开发 测试 用 例 。 测 试 人 员 必 须 在 测试 
过 程 中 尽量 发 现 测试 对 象 中 的 缺陷 ,以 尽 可 能 少 的 成 本 验证 尽量 多 的 需求 。 为 了 达到 这 
个 目的 ,采用 系统 化 的 测试 技术 是 必需 的 。 非 系统 化 的 测试 不 能 为 测试 对 象 提供 全 面 的 
质量 保证 。 测 试 人 员 需 要 对 测试 对 象 可 能 的 处 理 情况 进行 尽 可 能 多 的 测试 。 当 然 , 最 好 
的 方法 是 对 测试 对 象 处 理 的 所 有 情况 都 进行 测试 。 然 而 ,对 具有 一 定 规 模 和 难度 的 软件 
系统 进行 穷尽 测试 几乎 是 不 可 能 的 。 因 此 ,测试 人 员 需 要 采用 系统 化 的 方法 , 即 合适 的 
测试 技术 识别 测试 条 件 和 设计 测试 用 例 , 从 而 通过 执行 较 少 的 测试 用 例 达 到 软件 测试 的 
目的 ,例如 尽量 多 地 发 现 软件 中 存在 的 缺陷 。 

对 测试 对 象 进行 测试 可 以 采用 不 同 的 测试 技术 。 这 些 技术 主要 可 以 分 成 两 种 类 型 ; 
黑 盒 测试 技术 和 和 白 盒 测 试 技术 。 

黑 盒 测试 设计 技术 也 称 为 基于 说 明 的 测试 技术 , 指 的 是 基于 系统 功能 或 非 功 能 说 明 
来 设计 或 者 选择 测试 用 例 的 技术 , 它 不 涉及 被 测 软件 内 部 结构 , 即 通过 分 析 测 试 说 明 设 
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计 测 试用 例 。 黑 盒 测 试 技术 可 以 用 来 成 生 功 能 性 和 非 功能 性 的 测试 用 例 。 黑 盒 测 试 , 顾 
名 思 义 ,不 需要 使 用 任何 关于 被 测 组 件 或 系统 的 内 部 结构 信息 。 白 盒 测试 技术 也 称 为 结 
构 化 或 基于 结构 的 测试 技术 , 指 的 是 通过 分 析 组 件 /系统 的 内 部 结构 来 产生 或 选择 测试 
用 例 的 技术 。 

除了 黑 盒 测 试 技术 和 和 白 盒 测试 技术 ,本 大 纲 还 涉及 一 种 测试 技术 叫 作 基于 经 验 的 测 
试 技术 。 该 技术 根据 测试 人 员 的 经 验 、 知 识 和 直觉 来 进行 测试 用 例 设计 , 它 常 常 作为 系 
统 化 测试 的 有 效 补充 。 

黑 盒 测试 技术 和 和 白 盒 测试 技术 可 以 与 基于 经 验 的 测试 技术 结合 ,以 补充 开发 人 员 、 
测试 人 员 和 用 户 的 经 验 ,从 而 决定 什么 应 该 被 测试 。 测 试 过 程 中 测试 人 员 应 该 综合 应 用 
这 三 种 测试 技术 ,以 更 好 地 满足 对 测试 覆盖 率 和 测试 质量 的 要 求 。 

基于 说 明 的 测试 技术 具有 以 下 共同 特点 。 

(1) 使 用 正式 或 非 正式 的 模型 来 描述 需要 解决 的 问题 .软件 或 其 组 件 等 。 

(2) 根据 这 些 模 型 ,可 以 系统 地 导出 测试 用 例 。 

基于 结构 的 测试 技术 具有 以 下 共同 特点 。 

(1) 根据 软件 的 结构 信息 设计 测试 用 例 , 例 如 软件 代码 和 详细 设计 信息 。 

(2) 可 以 通过 已 有 的 测试 用 例 测量 软件 的 测试 覆盖 率 ,并 通过 系统 化 的 设计 测试 用 
例 提高 覆盖 率 。 

基于 经 验 的 测试 技术 具有 以 下 共同 特点 。 

(1) 测试 人 员 根 据 自 己 的 经 验 和 知识 编写 测试 用 例 。 

(2) 测试 人 员 、 开 发 人 员 .用户 和 其 他 的 利益 相关 者 对 软件 .软件 使 用 和 环境 等 方面 
所 掌握 的 知识 作为 信息 来 源 之 一 。 

(3) 对 可 能 存在 的 缺陷 及 其 分 布 情况 的 了 解 作 为 另 一 个 信息 来 源 。 


人 3 黑 盒 测 试 技术 


应 用 黑 盒 测 试 技术 ,测试 人 员 不 需要 了 解 被 测 对 象 的 内 部 结构 和 具体 设计 。 测 试 人 
员 通 过 分 析 被 测 对 象 的 测试 依据 设计 测试 用 例 。 如 果 测 试 能 够 考虑 到 所 有 输入 数据 的 
所 有 可 能 的 组 合 ,那么 它 就 是 一 种 完全 测试 。 根 据 测试 的 基本 原则 : 完全 组 合 的 所 有 可 
能 将 会 是 一 个 天 文 数字 ,因此 完全 测试 几乎 是 不 可 能 的 。 测 试用 例 设计 必须 从 所 有 可 能 
的 测试 用 例 中 进行 合理 的 选择 。 而 黑 盒 测 试 技 术 中 为 测试 人 员 提 供 了 减少 测试 组 合 的 
一 些 测试 技术 。 

本 章节 中 将 会 对 几 种 常见 的 黑 盒 测试 技术 基本 原理 进行 解释 ,并 通过 案例 阐述 应 用 
这 些 测试 技术 的 方法 。 这 些 黑 盒 测试 技术 主要 包括 : 

(1) 等 价 类 划分 。 

(2) 边界 值 分 析 。 
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(3) 决策 表 测 试 。 
(4) 状态 转换 测试 。 
(5) 用 例 测试 。 


4.3.1 等 价 类 划分 


1. 等 价 类 划分 技术 介绍 


等 价 类 划分 技术 是 一 种 典型 的 .常用 的 黑 盒 测试 技术 , 它 把 被 测 对 象 的 输入 数据 或 
输出 数据 根据 它们 的 处 理 方式 或 反应 划分 成 若干 个 等 价 类 。 等 价 类 指 的 是 根据 说 明 , 输 
入 域 或 输出 域 的 一 个 子 域内 的 任何 值 都 能 使 组 件 或 系统 产生 相同 的 响应 结果 , 即 针 对 同 
一 个 等 价 类 内 的 数据 ,被 测 系统 以 相同 的 方式 处 理 或 具有 相同 的 反应 。 该 技术 从 构建 的 
等 价 类 中 选取 典型 的 数据 进行 测试 ,这 些 测试 数据 称 为 等 价 类 的 代表 值 。 原 则 上 每 个 等 
价 类 中 只 要 选取 一 个 代表 值 来 设计 测试 用 例 ,就 能 覆盖 所 有 的 等 价 类 ,但 有 时 还 得 考虑 
不 同等 价 类 的 组 合 情 况 。 

从 测试 人 员 的 角度 而 言 ,测试 对 象 是 对 同一 等 价 类 中 的 不 同 数据 以 相同 的 方式 进行 
处 理 ,因此 只 需要 选择 等 价 类 中 的 一 个 具有 代表 性 的 数据 (代表 值 ) 进 行 测试 ,而 对 同一 
等 价 类 内 的 任何 其 他 数据 进行 测试 ,测试 对 象 不 会 有 其 他 不 同 的 反应 和 行为 。 

一 般 可 以 把 被 测 对 象 的 输入 或 输出 首先 分 成 两 个 基本 等 价 类 : 有 效 等 价 类 和 无 效 等 
价 类 。 有 效 等 价 类 内 包含 了 所 有 的 有 效 数据 ,而 无 效 等 价 类 内 包含 了 无 效 数据 , 即 被 测 
对 象 将 拒绝 这 些 数 据 或 对 这 些 数 据 进行 出 错 处 理 。 在 测试 过 程 中 不 仅 要 对 有 效 等 价 类 
内 的 数据 进行 测试 ,而 且 还 要 对 无 效 等 价 类 内 的 数据 进行 测试 。 在 划分 基本 等 价 类 后 还 
应 该 考虑 对 基本 等 价 类 进行 细 化 ,将 基本 等 价 类 划分 成 更 小 更 细 的 等 价 类 。 测 试 过 程 中 
需要 设计 不 同 的 测试 用 例 覆 盖 不 同 的 等 价 类 或 等 价 类 的 组 合 。 等 价 类 划分 技术 可 以 应 
用 在 不 同 的 测试 级 别 (例如 组 件 测试 .集成 测试 .系统 测试 和 验收 测试 ) 中 。 

这 里 以 计算 圣诞 节 奖 金 为 例 说 明 如 何 使 用 等 价 类 划分 技术 设计 测试 用 例 。 下 面 是 
针对 员工 圣诞 节 奖 金 计 算 的 一 段 需 求 描述 : 员工 在 公司 工作 时 间 超 过 3 年 ,可 以 得 到 月 
收入 50% 的 圣诞 节 奖 金 ; 员工 在 公司 工作 时 间 超 过 5 年 ,可 以 得 到 月 收入 75% 的 圣诞 节 
奖金 ; 员工 在 公司 工作 时 间 超 过 8 年 ,可 以 得 到 月 收入 100% 的 圣诞 节 奖 金 。 根 据 员 工 
的 不 同 服务 年 限 计算 奖 金 ,可 以 得 到 如 表 4-1 所 示 的 4 个 不 同 的 有 效 等 价 类 (valid 


Equivalence Classes,vEC) 。 


表 4-1 有 效 等 价 类 和 代表 值 


程序 参数 有 效 等 价 类 等 价 类 代表 值 
vyEQs 0 <= zx<=3 2 
vEC:: 3<~zr<=5 4 

可 二 服务 年 限 vEC:: 5<~z<=8 汉 
vECe: xz 二 8 12 
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在 这 里 ,选择 2.4.7.12 这 4 个 数据 作为 每 个 有 效 等 价 类 的 代表 值 。 假 如 在 这 基础 
上 再 增加 以 1、6、9、17 作为 输入 数据 的 测试 用 例 , 这 4 个 新 增加 的 测试 用 例 并 不 会 加 深 
测试 的 深度 ,也 不 会 发 现 更 多 的 软件 失效 。 基 于 这 样 的 假设 ,就 没有 必要 增加 额外 的 测 
试用 例 。 

除了 有 效 等 价 类 外 ,还 必须 对 无 效 等 价 类 进行 测试 ,同样 需要 考虑 无 效 等 价 类 的 细 
分 ,以 及 利用 这 些 无 效 等 价 类 的 代表 值 进行 测试 用 例 的 设计 。 在 前 面 提 到 的 例子 中 ,有 
如 下 两 个 无 效 等 价 类 (invalid Equivalence Classes,iEC) ,如 表 4-2 所 示 。 


表 4-2 无 效 等 价 类 和 代表 值 


程序 参数 无 效 等 价 类 等 价 类 代表 值 
让 Gz 二 0 员工 在 公司 的 服务 年 限 不 可 
能 是 负 值 

员工 服务 年 限 让 Ci: x 这 70， 服务 年 限 大 于 70 是 不 现 0 
实 的 


注意 : 值 70 是 根据 经 验 选择 的 ,因为 没有 公司 会 雇佣 员工 这 么 长 的 时 间 。 该 数值 也 
可 以 通过 开发 人 员 与 客户 的 沟通 获得 。 公 司 的 最 大 服务 年 限 应 该 和 实际 情况 相 一 致 。 

下 面 讲解 如 何 根据 前 面 的 等 价 类 划分 结果 系统 化 地 获取 测试 用 例 , 一 般 分 为 如 下 

(1) 确定 基本 等 价 类 : 对 需要 测试 的 每 个 输入 (参数 ) ,例如 在 组 件 测试 中 函数 /方法 
的 参数 或 者 系统 测试 中 的 屏幕 输入 域 , 需 要 确定 所 有 可 能 的 输入 值 范围 (包括 有 效 和 无 
效 的 输入 ) ,这 些 输入 值 范围 可 以 继续 细 分 成 不 同 的 等 价 类 。 首 先 确定 有 效 输入 , 它 包 含 
了 所 有 有 效 输入 值 的 有 效 等 价 类 ,测试 对 象 应 该 按照 测试 基础 文档 处 理 这 些 输 入 值 。 将 
不 在 这 个 范围 内 的 输入 值 看 成 是 包含 无 效 值 的 无 效 等 价 类 ,同样 需要 检查 测试 对 象 在 输 
人 无 效 值 时 是 如 何 进行 处 理 的 , 即 系统 或 组 件 的 健壮 性 测试 (或 逆向 测试 ) 。 

(2) 细 分 等 价 类 : 若 测试 对 象 的 说 明 中 规定 等 价 类 中 的 一 些 参数 需要 进行 不 同 的 处 
理 , 这 些 参数 就 需要 归 类 到 一 个 新 的 等 价 类 内 。 如 有 可 能 ,应 细 分 等 价 类 ,增加 测试 的 
深度 。 

(3) 选择 代表 值 和 设计 测试 用 例 : 对 每 个 等 价 类 ,选择 其 中 的 一 个 代表 值 进行 测试 。 
测试 人 员 需 要 定义 每 个 测试 用 例 的 前 置 条 件 、 期 望 结果 、 测 试 步 又 ,后 置 条 件 等 完成 测试 
用 例 的 设计 。 如 果 有 一 个 以 上 的 输入 (参数 ) , 则 需要 根据 一 定 的 策略 组 合 等 价 类 的 代表 
值 进 行 测试 。 

针对 输入 数据 划分 等 价 类 的 原则 同样 适用 于 输出 数据 。 而 根据 输出 数据 获取 测试 
用 例 的 代价 会 更 高 ,因为 针对 输出 数据 划分 的 等 价 类 ,必须 确定 相应 的 输入 数据 。 同 样 ， 
对 输出 数据 ,也 必须 考虑 无 效 等 价 类 的 情况 。 

划分 等 价 类 和 选择 其 中 的 代表 值 都 需要 仔细 项 酌 ,测试 中 发 现 缺陷 的 可 能 性 很 大 程 
度 依赖 于 等 价 类 划分 的 质量 ,以 及 选择 哪个 代表 值 设计 测试 用 例 。 通 常 ,从 说 明 或 者 其 
他 文档 中 获取 等 价 类 并 不 是 一 件 简单 的 事情 。 
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一 般 情况 下 ,选择 等 价 类 中 的 边界 值 作为 代表 值 设计 测试 用 例 , 其 效率 会 更 高 ,能 发 
现 更 多 的 缺陷 。 有 时 用 自然 语言 无 法 精确 定义 等 价 类 的 边界 ,容易 造成 需求 文档 的 描述 
存在 误解 或 者 不 正确 。 例 如 用 自然 语言 阐述 需求 “超过 3 年 ”, 可 能 的 意思 是 数据 3 包含 
在 等 价 类 之 内 (EC: zx 宇 3) ,也 可 能 是 在 等 价 类 之 外 (EC:z 二 3)。 这 样 ,加 入 zx = 3 的 
测试 用 例 就 可 能 发 现 这 个 歧义 。 在 后 面 的 章节 中 会 详细 讨论 边界 值 的 分 析 。 

表 4-3 中 通过 标识 一 个 整 型 输入 数据 的 所 有 可 能 的 等 价 类 来 阐述 构建 等 价 类 的 步 
又。 表 中 包括 了 功能 函数 calculate_price( ) 的 整 型 参数 Extras 的 等 价 类 划分 结果 。 


表 4-3 ” 整 型 数值 等 价 类 划分 


参数 等 价 类 
vEC: [MIN_INT,…, MAX_INTJ]JO 
iEC,: NaN (Nota Number) 


Extras 


需要 注意 的 是 ,这 里 的 值 域 与 纯粹 的 数学 概念 不 一 样 , 它 在 计算 机 内 受到 计算 机 所 
允许 的 最 大 值 和 最 小 值 的 约束 ,小 于 计算 机 的 最 小 值 以 及 大 于 计算 机 的 最 大 值 的 那些 值 
通常 会 引发 失效 ,因为 超过 了 这 个 极限 ,计算 机 就 无 法 进行 正常 工作 。 

考虑 下 面 无 效 等 价 类 的 情况 : 无 效 值 是 那些 大 于 或 者 小 于 允许 应 用 范围 的 值 ,或 者 
那些 非 数字 (NaN) 的 输入 。 假 如 程序 对 无 效 值 的 处 理 是 一 样 的 (例如 输出 错误 信息 “ 数 
据 无 效 ! "NOT_VALID 作为 异常 处 理 ) ,将 所 有 可 能 的 无 效 输入 值 作为 一 个 共同 的 无 效 等 
价 类 就 足够 了 。 浮 点 数 也 属于 这 个 无 效 等 价 类 ,因为 程序 对 3. 5 这 样 的 输入 值 也 会 显示 出 
错 信息 。 在 这 种 情况 下 ,等 价 类 划分 方法 就 不 需要 对 无 效 输入 值 进行 更 进一步 的 细 分 , 因 
为 程序 对 任何 一 种 错误 的 输入 下 都 应 该 有 相同 的 反应 。 但 是 ,对 于 一 个 有 经 验 的 测试 人 
员 ,他 还 是 会 采用 浮 点 数 的 测试 用 例 来 判断 程序 是 否 会 对 浮 点 数 进行 取 整 ,然后 继续 以 取 
整 的 数值 进行 处 理 。 设 计 这 些 额 外 的 测试 用 例 需 要 测试 人 员 采 用 基于 经 验 的 测试 技术 。 

由 于 程序 对 正 数 和 负数 的 处 理 不 一 样 ,因此 必须 对 等 价 类 进一步 细 分 。0 也 是 一 个 
经 常 导致 失效 的 输入 数据 ,因此 ,有 必要 对 它 进行 测试 。 细 化 后 的 代表 值 如 表 4-4 所 示 。 


表 4-4 整 型 等 价 类 代表 值 


参 数 等 价 类 代 表 值 
vECI: [MIN_INT, …， 0) 一 123 
Extras vEC: : [0, »…, MAX_INT] 654 
iEC! : NaN (Not a Number) 攻 


出 现在 等 价 类 描述 中 的 “)” 表 示 不 包含 给 定 值 的 一 个 开放 的 间隔 ,例如 *LMIN_ 
INT, …, 0)” 表 示 从 MIN_INT 到 0, 但 不 包括 0 的 整数 。 它 与 [MIN_INT,…, 一 1] 定 义 
的 是 同一 个 等 价 类 ,因为 现在 处 理 的 是 整 型 数据 。 


@ MIN_INT 和 MAX_INT 分 别 表示 计算 机 能 够 处 理 的 最 小 值 和 最 大 值 ,这 些 值 会 随 着 计算 机 硬件 的 不 同 而 
发 生变 化 。 
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对 于 整 型 输入 数据 的 例子 ,确定 等 价 类 和 相应 的 代表 值 相 对 比较 简单 。 但 是 除了 基 
本 的 数据 类 型 外 ,还 经 常会 出 现 复合 的 数据 结构 或 对 象 集合 作为 值 域 的 情况 ,这 个 时 候 
等 价 类 的 划分 和 代表 值 选取 的 难度 要 更 大 一 些 。 

下 面 的 例子 可 以 阐明 对 象 集合 类 型 的 等 价 类 划分 : 旅游 者 可 以 是 儿童 .青少年 .成 年 
人 、 学 生 、 残 疾 人 或 者 退休 者 。 假 如 测试 对 象 对 每 种 不 同类 型 的 旅游 者 有 不 同 的 处 理 方 
式 , 则 每 种 可 能 的 情况 都 需要 有 相应 的 测试 用 例 来 验证 。 假 如 需求 中 没有 规定 对 不 同 的 
旅游 者 类 型 需要 不 同 的 处 理 , 这 时 可 能 只 需 设 计 一 个 测试 用 例 就 足够 了 。 在 这 种 情况 
下 ,只 要 随意 选择 旅游 者 列表 中 的 一 个 正确 的 值 即 可 。 

假如 测试 对 象 是 一 个 计算 旅行 费用 的 程序 ,而 其 中 费用 的 多 少 和 旅游 者 的 类 型 有 
关 , 则 必须 设计 6 个 不 同 的 测试 用 例 进 行 验证 。 费 用 的 计算 对 不 同类 型 的 旅游 者 可 能 是 
不 一 样 的 ,这 时 候 就 需要 了 解 需求 的 详细 信息 。 为 了 证 明 费 用 计算 的 正确 性 ,对 每 种 费 
用 计算 都 需要 相应 的 测试 来 进行 验证 。 

假如 测试 对 象 是 处 理 预订 座位 的 程序 , 则 只 需 选 择 其 中 的 一 个 代表 值 即 可 ,例如 选 
择 旅游 者 是 成 年 人 的 情况 ,这 里 不 需要 具体 关注 是 青少年 还 是 退休 者 预定 了 座位 。 需 求 
说 明 应 该 对 具体 的 内 容 进行 说 明 并 且 进 行 相 应 的 分 析 。 

以 下 提示 可 以 帮助 确定 等 价 类 。 

(1) 根据 说 明确 定 输入 和 输出 的 范围 和 条 件 。 

(2) 针对 每 个 规定 的 范围 或 条 件 , 划 分 等 价 类 : 

QO 假如 需求 描述 的 范围 是 连续 的 数据 域 , 则 可 以 创建 一 个 有 效 等 价 类 和 两 个 无 效 等 
价 类 。 连 续 的 有 效 输入 是 一 个 有 效 等 价 类 ,另外 两 个 无 效 等 价 类 分 别 是 这 个 连续 数据 域 
的 两 侧 。 例 如 ,公司 定义 的 员工 工资 范围 为 2000 一 51 999 元 /月 。 那 么 可 以 得 到 一 个 
2000 一 51 999 的 有 效 等 价 类 (包括 2000, 包 括 51 999); 两 个 无 效 等 价 类 分 别 是 小 于 2000 
的 值 和 大 于 51 999 的 值 。 对 于 有 效 等 价 类 ,可 以 选择 5000 作为 代表 值 ,而 对 于 无 效 等 价 
类 ,可 以 分 别 选择 1000 和 60 000 作为 代表 值 。 

@ 假如 描述 的 是 数值 的 个 数 , 则 可 以 创建 一 个 有 效 等 价 类 (所 有 可 能 的 有 效 值 ) 和 两 
个 无 效 等 价 类 ( 少 于 和 多 于 有 效 的 个 数 ) 。 例 如 ,视屏 点 播 组 可 以 加 入 的 用 户 是 1 一 5 个。 
那么 可 以 得 到 一 个 有 效 等 价 类 (1 一 5 个 用 户 ) ,两 个 无 效 等 价 类 分 别 是 小 于 1 个 用 户 和 大 
于 5 个 用 户 。 对 于 有 效 等 价 类 ,可 以 选择 3 作为 代表 值 ; 对 于 无 效 等 价 类 可 以 分 别 选 择 0 
和 6 作为 代表 值 。 

@ 假如 描述 的 是 一 组 值 CN 个 值 ) ,并 且 测 试 对 象 对 每 个 值 进行 不 同 的 处 理 , 则 可 以 
为 集合 中 的 每 个 值 创建 一 个 有 效 等 价 类 (只 包含 这 个 值 ) ,总 共有 N 个 有 效 等 价 类 和 一 个 
无 效 等 价 类 (包含 集合 以 外 的 所 有 可 能 的 其 他 值 ) 。 

@ 假如 描述 的 是 一 组 值 CN 个 值 ) ,并 且 测 试 对 象 对 每 个 值 都 进行 同样 的 处 理 , 则 可 
以 针对 集合 中 的 这 组 值 创建 一 个 有 效 等 价 类 (可 以 挑选 任何 其 中 任何 一 个 值 作为 代表 
值 ) 和 一 个 无 效 等 价 类 (包含 集合 以 外 的 所 有 可 能 的 其 他 值 ) 。 

@ 假如 描述 的 是 一 个 必须 满足 的 条 件 , 则 创建 一 个 有 效 等 价 类 和 一 个 无 效 等 价 类 ， 
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分 别 从 两 个 等 价 类 中 取 值 来 测试 这 个 条 件 的 满足 与 不 满足 情况 。 

假如 描述 的 是 多 个 必须 满足 的 条 件 , 则 创建 一 个 有 效 等 价 类 (同时 满足 所 有 要 求 
的 条 件 ) 和 若干 个 无 效 等 价 类 (分 别 违反 其 中 的 一 个 条 件 )。 例 如 ,变量 名 包含 数字 和 字 
母 ,必须 以 字母 开头 ,并 且 长 度 为 8, 那么 可 以 得 到 一 个 有 效 等 价 类 , 即 变量 名 包含 数字 和 
字母 ,以 字母 开头 并 且 长 度 为 8; 若干 个 无 效 等 价 类 ,例如 以 数字 开头 、 包 含 不 是 字母 或 
数字 的 其 他 符号 或 者 变量 名 长 度 不 是 8。 

(3) 假如 不 能 确认 在 一 个 等 价 类 内 的 数值 是 否 会 被 测试 对 象 等 同 对 待 , 则 应 该 将 此 
等 价 类 进一步 细 分 。 


2. 测试 用 例 


通常 ,测试 对 象 会 有 一 个 以 上 的 输入 参数 ,而 等 价 类 划分 技术 通常 为 测试 对 象 的 每 
个 参数 至 少 创建 两 个 等 价 类 , 即 一 个 有 效 等 价 类 和 一 个 无 效 等 价 类 ,因此 对 每 个 参数 都 
必须 至 少 有 两 个 代表 值 作为 测试 输入 。 

设计 测试 用 例 时 ,需要 给 每 个 参数 赋予 一 个 输入 值 。 为 此 ,测试 人 员 必 须 确定 怎样 
组 合 这 些 代 表 值 ,使 其 成 为 一 组 高 效 的 输入 数据 。 为 了 更 好 地 触发 测试 对 象 的 所 有 反应 
(通过 先前 的 等 价 类 划分 提示 ) ,可 以 根据 下 面 的 准则 组 合 相应 等 价 类 的 输入 代表 值 。 

(1) 有 效 等 价 类 组 合 : 设计 一 组 测试 用 例 ,组 合 所 有 有 效 等 价 类 的 代表 值 , 使 得 所 有 
有 效 等 价 类 的 组 合 均 被 测试 用 例 覆 盖 。 这 些 测试 用 例 也 叫 正 向 测试 用 例 。 

(2) 无 效 等 价 类 组 合 : 无 效 等 价 类 的 代表 值 只 能 和 其 他 有 效 等 价 类 的 代表 值 进行 组 
合 。 因 此 每 个 无 效 等 价 类 将 产生 一 个 专门 测试 无 效 输入 数据 的 测试 用 例 ,或 者 叫 逆向 测 
试用 例 ,以 测试 组 件 或 系统 的 健壮 性 。 

有 效 测试 用 例 的 个 数 等 于 每 个 参数 的 有 效 等 价 类 个 数 的 乘积 ,即使 具有 几 个 有 限 的 
参数 也 可 能 会 产生 数 以 百 计 的 有 效 测 试用 例 。 然 而 在 现实 中 很 少 会 使 用 这 么 多 的 测试 
用 例 , 往 往 会 选择 部 分 测试 用 例 进 行 测试 。 为 了 提高 效率 ,又 要 保证 测试 质量 ,因此 有 必 
要 采用 更 多 的 规则 来 减少 有 效 测试 用 例 的 数目 ,例如 : 

(1) 由 所 有 代表 值 组 合 而 成 的 测试 用 例 按 使 用 频率 (典型 的 使 用 特征 ) 进 行 排序 ,并 
按照 这 个 序列 设置 优先 级 ,只 选择 重要 的 典型 测试 用 例 ( 经 常 使 用 的 那些 组 合 ) 。 

(2) 优先 考虑 包含 边界 值 或 边界 值 组 合 的 测试 用 例 。 

(3) 履 盖 任 意 两 个 等 价 类 代表 值 的 组 合 ( 即 两 两 组 合 代替 完全 组 合 ) 。 

(4) 保证 满足 最 小 原则 : 每 一 个 等 价 类 的 代表 值 至 少 在 一 个 测试 用 例 中 出 现 过 。 

一 般 情 况 下 ,一 个 无 效 等 价 类 的 代表 值 不 应 该 与 其 他 无 效 等 价 类 的 代表 值 进行 组 
合 。 无 效 等 价 类 的 代表 值 应 该 只 和 有 效 等 价 类 的 代表 值 进行 组 合 ,因为 一 个 无 效 参数 值 
通常 会 触发 测试 对 象 的 异常 处 理 ,而且 与 剩 下 的 其 他 参数 值 是 无 关 的 。 假 如 测试 用 例 组 
合 了 超过 一 个 以 上 的 无 效 值 .可 能 导致 相互 的 缺陷 屏蔽 ,而 实际 上 可 能 只 测试 到 了 其 中 
一 个 参数 的 异常 处 理 ; 在 出 现 失效 时 ,也 很 难 判 断 是 哪个 无 效 值 触发 了 这 个 失效 ,这 就 需 
要 额外 的 时 间 和 精力 来 做 进一步 分 析 。 
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下 面 以 虚拟 汽车 销售 助理 系统 (VSR) 的 子 系统 DreamCar 的 一 个 功能 函数 caculate_ 
price() 作 为 例子 阐述 等 价 类 划分 技术 ,此 子 系统 的 功能 函数 描述 如 下 。 

(1) 汽车 价格 的 起 点 是 基本 价 (Baseprice) 减 去 经 销 商 折扣 (Discount) 。 

(2) 在 汽车 价格 上 增加 特殊 设备 包 的 特殊 价格 (Specialprice) 和 附加 设备 的 价格 
(Extraprice) 。 这 里 的 汽车 的 基本 配置 就 相当 于 裸 车 ,客户 可 以 根据 自己 的 需要 挑选 附 
加 设备 进行 配置 ,如 增加 音响 设备 .反光 镜 加 热 去 雾 系 统 等 。 销 售 商 也 会 根据 一 定 的 销 
售 策略 将 一 组 附加 设备 打包 后 优惠 销售 ,这 就 是 特殊 设备 包 。 

(3) 如 果 选 择 了 三 个 或 更 多 的 附加 设备 ,并 且 这 些 设备 不 包含 在 特殊 设备 包 中 ,这 些 
附加 设备 可 以 有 10% 的 折扣 。 如 果 选 择 了 5 个 或 更 多 的 附加 设备 ,并 且 这 些 设备 不 包含 
在 特殊 设备 包 中 ,这 些 附加 设备 的 折扣 可 以 增加 到 15%。 

(4) 经 销 商 明确 给 客户 的 经 销 商 折 扣 只 与 汽车 的 基本 价 和 选择 的 附加 设备 有 关 , 特 
殊 设 备 没有 折扣 。 

(5) 由 经 销 商 给 客户 的 经 销 商 折扣 和 附加 设备 超过 一 定数 量 而 给 的 折扣 不 能 合并 。 
在 计算 附加 装备 价格 时 ,如 果 经 销 商 给 客户 的 经 销 商 折扣 大 于 附加 设备 的 折扣 , 则 以 经 
销 商 给 客户 的 经 销 商 折扣 为 准 , 和 否则 以 附加 设备 折扣 为 准 。 

需要 测试 这 个 函数 是 否 在 输入 数据 后 始终 能 根据 规范 说 明正 确 地 计算 出 总 价 。 假 
设 只 有 卫 数 的 功能 描述 和 函数 的 接口 描述 ,并 不 清楚 函数 的 内 部 结构 。 


double calculate price ( double baseprice, //base price of the vehicle 
double specialprice, //special model addition 
double extraprice, //price of the extras 
int extras, //number of extras 
double discount //dealer' s discount 


) 


应 用 等 价 类 技术 从 输入 参数 导出 所 需 的 测试 用 例 。 首 先 , 需 要 确定 每 个 输入 参数 的 
取 值 范围 ,从 而 获取 每 个 输入 参数 的 有 效 值 的 等 价 类 和 无 效 值 的 等 价 类 。 

利用 这 个 技术 ,并 根据 接口 说 明 , 为 每 个 参数 生成 一 个 有 效 等 价 类 和 一 个 无 效 等 价 
类 ,如 表 4-5 所 示 。 


表 4-5 参数 的 有 效 等 价 类 和 无 效 等 价 类 


序号 参数 等 价 类 

1 Baseprice vECn: [MIN_DOUBLE, … , MAX_DOUBLE] 
汽车 基本 价格 iECn: NaN 

2 Specialprice vECn: [MIN_DOUBLE, … , MAX DOUBLE] 
特殊 价格 iECa: NaN 

3 Extraprice vECa : [MIN_DOUBLE, … , MAX _ DOUBLE] 
附加 设备 价格 iECa : NaN 

4 Extras vECu: [MIN_INT, … , MAX_INT] 

附加 设备 数量 iECu: NaN 

5 Discount vECa: [MIN_DOUBLE, … ,; MAX_DOUBLE] 
经 销 商 折 扣 iECa: NaN 
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为 了 进一步 地 细 分 这 些 等 价 类 ,需要 参考 函数 的 功能 性 方面 的 信息 ,这 些 信息 可 以 
从 函数 的 说 明 中 获取 。 从 说 明 中 可 以 得 到 以 下 和 测试 相关 的 结论 。 

(1) 参数 1 一 3 是 汽车 价格 。 价 格 不 能 是 负数 ,但 在 说 明 中 没有 对 价格 进行 任何 的 
限制 。 

(2) 附加 设备 的 折扣 计算 取决 于 附加 设备 的 数量 Extras 的 值 (如 果 Extras 宇 3 则 折 
扣 率 为 10% ,如 果 Extras 三 5 则 折扣 率 为 15%)。 参 数 4 Extras 定义 了 选择 的 附加 设备 
的 数量 ,因此 是 整数 ,不 能 是 负数 ,但 说 明 中 没有 规定 数量 的 上 限 。 

(3) 参数 5 Discount 代表 的 是 经 销 商 折扣 ,以 0 一 100 的 百分比 来 表示 。 因 为 说 明 中 
以 百分比 的 方式 定义 了 为 附加 设备 的 折扣 ,所 以 测试 人 员 可 以 假设 参数 Discount 的 输入 
方式 应 该 也 是 百分比 的 方式 。 通 过 和 客户 进行 沟通 可 以 更 清楚 地 了 解 这 个 问题 。 

该 功能 的 说 明 不 仅 是 测试 分 析 和 设计 的 基础 ,还 可 以 通过 对 它 进行 分 析 发 现 说 明 中 
的 一 些 漏洞 。 测 试 人 员 可 以 根据 应 用 领域 和 日 常 的 知识 以 及 测试 经 验 ,或 者 通过 求助 于 
其 他 同事 (测试 人 员 或 者 开发 人 员 ) 来 填补 这 些 漏洞 。 假 如 还 有 疑问 , 则 可 以 和 客户 进行 
讨论 。 分 析 过 程 中 可 以 对 前 面 定义 的 等 价 类 进一步 细 化 。 等 价 类 划分 得 越 细 , 设 计 的 测 
试 将 越 准确 和 完备 。 完 成 等 价 类 划分 的 工作 需要 考虑 说 明 中 每 个 输入 参数 的 所 有 条 件 ， 
同时 也 需要 结合 测试 人 员 的 理论 知识 和 实践 经 验 。 

针对 上 述 例子 ,总 共 可 以 生成 18 个 等 价 类 ,其 中 7 个 为 有 效 等 价 类 ,11 个 为 无 效 等 
价 类 。 为 了 获得 测试 的 输入 数据 ,必须 在 每 个 等 价 类 内 选择 一 个 代表 值 。 根 据 等 价 类 划 
分 理论 ,可 以 选择 等 价 类 中 的 任何 一 个 值 作为 代表 值 。 在 现实 中 ,很 难 进 行 完 美的 等 价 
类 细 分 。 由 于 缺少 详细 信息 .时间 不 足 ,参数 之 间 有 复杂 的 逻辑 关系 , 细 分 到 一 定 程度 后 
就 会 停止 进一步 的 细 分 ,而 有 些 等 价 类 甚至 会 有 一 些 重合。 因此 ,在 选择 代表 值 时 必须 
考虑 在 一 个 等 价 类 内 测试 对 象 可 能 会 有 不 同 处 理 的 那些 值 ,或 最 频繁 出 现 的 那些 值 。 等 
价 类 和 代表 值 如 表 4-6 所 示 。 


表 4-6 等 价 类 和 代表 值 


参数 等 价 类 代 表 值 
_ vEC11: [0, … , MAX_DOUBLE] 20000. 00 
ER 网 iECI11。 [MIN_DOUBLE, … , 0) 一 1.00 
iEC12: NaN “abc” 
vEC21: [0, … , MAX_DOUBLE] 3450. 00 
ee iEC21: [MIN_DOUBLE, *… , 0) =L.00 
iEC22: NaN “abc” 
vEC31: [0, …，MAX_DOUBLE] 6000. 00 
ee iEC31: [MIN_DOUBLE, … , 0) 一 1.00 
iEC32: NaN “abc” 
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续 表 
参 数 等 价 类 代 表 值 
vEC41: [0, …，2] 1 
vEC42: [3, 4] 3 
Ex EC43: [5 MAX_INT] 20 
、 M : nnd 2 本 
办 加 设备 数量 iEC41: [MIN_INT, … , 0) 一 1.00 
iEC42: NaN “abc” 
vEC51: [0o, … ，100] 10. 00 
Discount iEC51: [MIN_DOUBLE,，… , 0) —1.00 
经 销 商 折 扣 iEC52: (100, … , MAX_DOUBLE] 101. 00 
iEC53: NaN “abc” 


因此 ,在 这 个 例子 中 ,在 有 效 等 价 类 内 选择 了 实际 使 用 中 最 具有 说 服 力 的 代表 值 , 以 
及 能 覆盖 在 应 用 过 程 中 可 能 会 频繁 出 现 的 场景 的 代表 值 。 对 于 无 效 等 价 类 ,选择 了 一 些 
比较 简单 的 代表 值 作为 测试 对 象 的 输入 。 
下 一 步 是 将 代表 值 组 合 到 测试 用 例 。 根 据 上 面 的 规则 ,得 到 有 效 测试 用 例 数 1X1x 
1X3X1= 3( 通 过 组 合 有 效 等 价 类 的 代表 值 ) ,以 及 无 效 测试 用 例 2 十 2 十 2 十 2 十 3 二 11 
(为 每 个 无 效 等 价 类 的 代表 值 进行 测试 )。 从 18 个 等 价 类 中 总 共 得 到 14 个 测试 用 例 (如 


表 4-7 所 示 )。 


表 4-7 函数 calculate_price( ) 的 测试 用 例 


Test 参 数 

enae Baseprice Specialprice Extraprice Extras Discount Result 
| 20 000.00 3450.00 6000. 00 时 10. 00 27450. 00 
2 20 000.00 3450. 00 6000. 00 10.00 26850. 00 
3 20 000.00 3450. 00 6000.00 20 10. 00 26550. 00 
4 一 1.00 3450. 00 6000. 00 1 10. 00 NOT_VALID 
5 "abe" 3450. 00 6000. 00 1 10.00 NOT_VALID 
6 20 000. 00 一 1.00 6000. 00 1 10. 00 NOT_VALID 
7 20 000. 00 "abe" 6000. 00 1 10. 00 NOT_VALID 
8 20 000.00 3450. 00 一 和 00 1 10. 00 NOT_VALID 
9 20 000. 00 3450. 00 "abc” 1 10.00 NOT_VALID 
10 20 000. 00 3450. 00 6000. 00 一 相生 10.00 NOT_VALID 
11 20 000. 00 3450. 00 6000. 00 "abc” 10.00 NOT_VALID 
12 20 000. 00 3450. 00 6000. 00 3 一 1.00 NOT_VALID 
13 20 000. 00 3450. 00 6000.00 1 101.00 NOT_VALID 
14 20 000. 00 3450.00 6000. 00 1 "abc" NOT_VALID 


对 有 效 等 价 类 ,保证 只 有 一 个 参数 发 生变 化 ,其 他 参数 使 用 相同 的 代表 值 , 从 而 来 验 
证 测试 对 象 对 输入 值 的 反应 。 因 为 5 个 参数 中 的 4 个 参数 都 只 有 一 个 有 效 等 价 类 ,因此 
得 到 的 测试 用 例 不 多 ,不 需要 再 减少 测试 用 例 的 数目 。 
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在 选择 了 测试 输入 以 后 ,需要 确定 每 个 测试 用 例 的 期 望 输出 。 对 逆向 测试 用 例 , 选 
择期 望 结果 比较 简单 ,期望 结果 是 测试 对 象 输出 相应 的 错误 代码 (例如 "404 错误 ") 或 者 
测试 对 象 输出 的 相应 的 错误 信息 (例如 "数据 无 效 1")。 但 对 于 有 效 测试 ,期 望 的 输出 必 
须 经 过 分 析 计 算 才 能 得 到 。 


3. 等 价 类 覆盖 率 计算 


等 价 类 覆盖 率 可 以 定义 为 已 经 覆盖 (使 用 ) 的 等 价 类 数目 与 总 等 价 类 数目 之 比 : 
等 价 类 覆盖 率 = (已 覆盖 等 价 类 数目 /总 等 价 类 数目 ) X100%。 

假设 定义 了 18 个 等 价 类 ,但 设计 的 测试 用 例 中 只 覆盖 了 其 中 的 15 个 等 价 类 , 则 等 
价 类 覆盖 率 为 (15/18)X100% = 83. 33%。 

在 虚拟 汽车 销售 助理 统 的 例子 中 ,14 个 测试 用 例 已 经 覆盖 了 所 有 18 个 等 价 类 ,在 测 
试用 例 中 每 个 等 价 类 至 少 包含 了 一 个 代表 值 。 因 此 ,执行 14 个 测试 用 例 可 以 保证 达到 
100% 的 等 价 类 覆盖 率 。 假 如 后 面 3 个 测试 用 例 由 于 时 间 的 限制 没有 执行 , 即 14 个 测试 
用 例 中 只 执行 了 11 个 测试 用 例 ,参数 Discount 的 所 有 3 个 无 效 等 价 类 都 没有 被 覆盖 到 ， 
得 到 的 等 价 类 覆盖 率 将 是 (15/18)X100% = 83.33%。 也 就 是 说 ,尽管 在 测试 用 例 设计 
过 程 中 ,设计 的 测试 用 例 达 到 了 100 儿 的 等 价 类 覆盖 率 ,但 是 在 执行 过 程 中 ,由 于 3 个 测 
试用 例 没有 被 执行 ,所 以 执行 并 没有 达到 100 儿 的 等 价 类 覆盖 率 。 

测试 对 象 要 求 测试 得 越 彻底 ,需要 达到 的 节 盖 率 就 会 越 高 。 在 测试 执行 之 前 ,可 以 
事先 定义 蓝 盖 率 作为 决定 测试 活动 是 否 充分 的 一 个 标准 。 而 在 测试 执行 之 后 , 它 又 作为 
判断 测试 强度 是 否 达到 要 求 的 一 个 指标 。 

在 上 面 的 例子 中 ,假如 要 求 的 等 价 类 覆盖 率 定义 为 80%, 则 只 要 获 盖 18 个 等 价 类 中 
的 14 个 就 可 以 达到 这 个 要 求 , 即 通过 执行 能 至 少 覆 盖 14 个 等 价 类 的 测试 用 例 。 测 试 覆 
盖 率 是 完成 测试 的 一 个 可 测量 的 准则 。 

前 面 的 例子 也 表明 了 标识 等 价 类 的 重要 性 。 假 如 没有 细 分 和 标识 所 有 的 等 价 类 , 选 
择 用 于 设计 测试 用 例 的 输入 数据 就 会 减少 ,得 到 的 测试 用 例 数 量 也 将 相应 地 减少 。 这 种 
情况 下 ,可 以 得 到 较 高 的 测试 覆盖 率 , 但 这 是 基于 错误 的 等 价 类 数量 的 基础 上 计算 出 来 
的 ,所 宣称 的 优秀 的 测试 结果 并 不 能 反映 实际 的 测试 强度 。 只 有 充分 地 分 析 需 求 和 认真 
地 构建 了 等 价 类 ,利用 等 价 类 划分 技术 生成 的 测试 用 例 才 是 优秀 的 。 


4. 等 价 类 划分 优 缺 点 分 析 


在 有 明确 的 条 件 和 限制 的 情况 下 ,利用 等 价 类 划分 技术 可 以 帮助 测试 人 员 在 有 限 的 
时 间 内 选择 合适 的 测试 数据 和 组 合 , 以 减少 元 余 的 测试 用 例 。 宛 余 的 测试 用 例 通常 是 使 
用 了 同一 个 等 价 类 内 的 不 同 代表 值 。 

不 仅 可 以 使 用 输入 或 输出 来 划分 等 价 类 ,也 可 以 用 被 测 对 象 的 内 部 值 ` 状 态 . 时 间 相 
关 的 值 等 划分 等 价 类 ,例如 某 个 事件 之 前 或 之 后 的 值 ,以 及 接口 参数 等 。 等 价 类 划分 技 
术 可 以 用 在 所 有 组 件 测试 集成 测试 ,系统 测试 和 验收 测试 级 别 中 。 


第 4 章 ”测试 设计 技术 a 7 


假如 只 单独 考虑 输入 或 输出 数据 ,可 能 会 忽略 这 些 数 据 之 间 的 相互 关系 以 及 相互 作 
用 。 假 如 把 它们 之 间 的 关系 都 考虑 在 内 , 则 测试 代价 又 会 非常 高 ,不 过 测试 人 员 可 以 通 
过 进一步 的 等 价 类 划分 ,通过 组 合 来 描述 其 中 的 测试 用 例 , 有 时 也 称 为 范围 分 析 , 和 缺陷 
导向 技术 相 结合 ,例如 边界 值 分 析 。 当 然 也 可 以 采用 其 他 的 黑 盒 测 试 设 计 技 术 , 如 决策 
表 技 术 等 。 


4.3.2 边界 值 分 析 


1. 边界 值 分 析 技术 介绍 


边界 值 分 析 指 的 是 通过 分 析 输 入 或 输出 的 边界 值 并 取 值 进行 测试 用 例 设计 的 一 种 
黑 盒 测试 技术 。 在 软件 开发 过 程 中 大 量 的 错误 是 发 生 在 输入 或 输出 范围 的 边界 上 ,而 不 
是 发 生 在 输入 输出 范围 的 内 部 ,例如 开发 过 程 中 没有 明确 定义 边界 值 ,或 者 编程 人 员 在 
边界 值 上 存在 的 误解 。 因 此 针对 各 种 边界 情况 设计 测试 用 例 ,可 以 测试 出 更 多 的 错误 。 

通常 边界 值 分 析 是 作为 对 等 价 类 划分 的 补充 ,这 种 情况 下 ,其 测试 用 例 来 自 等 价 类 
的 边界 。 边 界 值 分 析 可 以 应 用 于 所 有 的 测试 级 别 。 这 种 方法 相对 简单 ,发 现 缺 陷 的 能 力 
也 比较 强 ,详细 的 说 明 对 边界 值 分 析 很 有 帮助 。 

边界 值 分 析 通常 分 析 边 界 值 和 两 个 边界 邻近 的 值 ( 等 价 类 里 面 的 值 和 等 价 类 外 面 的 
值 ) ,在 此 要 以 最 小 步 长 在 边界 值 的 两 个 不 同方 向 上 取 值 ,对 于 浮 点 数 ,可 以 把 定义 的 误 
差 值 作为 最 小 步 长 。 因 此 对 于 每 个 边界 值 .可 以 得 到 3 个 测试 数据 。 如 果 等 价 类 的 上 限 
的 边界 值 等 于 邻近 等 价 类 的 下 限 边界 值 , 则 各 等 价 类 只 需要 考虑 各 自 等 价 类 里 面 的 测试 
数据 。 

然而 在 很 多 情况 下 ,边界 值 刚好 属于 另 一 个 等 价 类 ,因此 不 存在 实际 的 边界 值 。 在 
这 种 情况 下 ,测试 时 也 可 以 只 选择 两 个 边界 值 : 一 个 在 等 价 类 内 部 , 另 一 个 在 等 价 类 
外 部 。 

对 于 圣诞 节 发 放 奖 金 这 个 例子 ,有 4 个 等 价 类 。 等 价 类 3 和 4 分 别 描述 为 vEC3: 5 二 
2z< 一 8 和 vEC4:z 二 8。 为 了 测试 两 个 等 价 类 的 边界 值 , 可 以 选择 数值 8 和 9。 其 中 数 
值 8 属于 YEC3 ,并 且 属于 该 等 价 类 的 最 大 可 能 值 , 而 数值 9 是 等 价 类 vEC4 的 最 小 可 能 
的 值 。 选 择 数值 7 和 10 没有 更 大 的 意义 ,因为 它们 属于 相应 等 价 类 且 为 更 进一步 远离 
边界 的 内 部 数值 。 

那么 ,什么 情况 下 只 需 选 择 8 和 9 进行 测试 呢 ? 在 什么 时 候 还 需要 选择 数值 7 进行 
额外 的 测试 呢 ? 

这 时 ,检查 测试 对 象 的 具体 实现 可 能 会 有 所 帮助 。 程 序 可 能 会 包含 控制 语句 f(x 二 8)。 
但 是 如 果 这 个 控制 语句 写 错 了 ,那么 需要 用 什么 样 的 测试 用 例 来 发 现 这 个 问题 呢 ? 如 
表 4-8 所 示 。 测 试 数值 7.8 和 9 在 让 判断 语句 中 分 别 产生 了 FALSE FALSE 和 TRUE 
的 结果 ,同时 执行 了 程序 的 相应 部 分 。 执 行 测试 数据 7 看 起 来 并 没有 什么 额外 的 价值 ， 
因为 测试 数据 8 已 经 可 以 得 到 正确 的 输出 FALSE。 假 如 语句 错误 地 写成 if (x 二 = 8)， 
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输入 数据 7.8 和 9 将 分 别 得 到 输出 FALSE、TRUE 和 TRUE。 但 即使 是 这 样 ,测试 数据 
7 仍然 没有 得 到 不 同 的 结果 ,因此 可 以 忽略 7 这 个 输入 数据 。 只 有 当 语 句 错误 地 写成 计 
(从 二 二 8), 数 据 7.8.9 作为 测试 用 例 的 输入 时 ,才能 得 到 输出 TRUE、FALSE 和 
TRUE。 这 里 只 有 使 用 测试 数据 7 的 测试 用 例 才能 发 现 这 个 缺陷 ,而 数值 8 和 9 得 到 的 
结果 都 与 期 望 结果 相 一 致 ,或 者 说 得 到 的 结果 和 正确 语句 f(x > 8) 执 行 时 产生 的 结果 
一 样 。 

表 4-8 控制 语句 (x > 8) 的 边界 分 析 


序号 表 达 式 z=7 z=8 x=9 
1 if (x>8) FALSE FALSE TRUE 
2 if (x 之 8) FALSE TRUE TRUE 
3 if (x =>8) TRUE FALSE TRUE 
4 if (x =<8) TRUE FALSE FALSE 
5 if (x =<==8) TRUE TRUE FALSE 


提示 : 用 参数 zx 为 7.8 和 9 执行 了 错误 语句 f(x 过 8), 得 到 的 结果 是 TRUE、 
FALSE 和 FALSE, 而 错误 语句 if (x 二 二 8) 得 到 的 结果 是 TRUE TRUE 和 FALSE, 得 
到 的 实际 结果 和 期 望 结 果 是 不 同 的 ,因此 执行 输入 数据 为 8 和 9 的 测试 用 例 就 可 以 发 现 
两 者 之 间 的 不 同 。 

由 于 vEC3 和 vEC4 是 相 邻 的 两 个 等 价 类 ,因此 当 输入 数据 为 7 和 8 时 属于 vEC3 等 
价 类 (75% 的 月 薪 作 为 奖金 ), 当 输入 数据 为 9 时 属于 vEC4 等 价 类 (100% 的 月 薪 作 为 奖 
金 )。 假 如 开发 人 员 在 实现 判定 语句 时 产生 逻辑 错误 ,将 会 导致 错误 的 结果 。 

需要 考虑 的 是 ,在 什么 情况 下 仅 需 要 两 个 输入 数据 进行 测试 (上 例 中 的 8 和 9) ,在 什 
么 情况 下 需要 三 个 边界 值 进 行 测试 (上 例 中 的 7、.8 和 9)? 在 上 面 的 例子 中 ,错误 的 语句 
这 (x<< 二 8) 应 该 可 以 在 代码 评审 的 时 候 发 现 , 因 为 它 并 没有 检查 数据 值 的 边界 f(x 二 8) ,而 
是 检查 两 个 数据 是 否 相等 ,然而 ,这 个 缺陷 很 容易 被 忽视 。 只 有 用 三 个 值 对 边界 值 进行 
测试 ,才能 发 现 可 能 的 边界 条 件 的 错误 实现 。 

对 于 上 面 表 4-4 中 测试 整 型 输入 数据 的 例子 ,如 果 考 虑 其 边界 值 , 总 共 可 以 得 到 12 
个 测试 用 例 ,它们 的 输入 值 是 : 

We; 

MIN_INT— 1,MIN_INT,MIN_INT+1, 

= 

=170,15 

654, 

MAX_INT— 1,MAX_INT,MAX INT+1} 

输入 值 是 一 1 的 测试 用 例 用 来 测试 等 价 类 EC1: [MIN_INT,…0) 的 最 大 值 ,这 个 测 
试用 例 同时 验证 了 等 价 类 EC2: [0,…MAX_INTJ] 下 限 边界 值 0 的 最 小 步 长 的 数值 。 这 
个 数值 处 于 这 个 等 价 类 之 外 。 有 些 情况 下 比 上 限 边界 值 大 的 值 和 下 限 边界 值 小 的 值 是 
无 法 作为 输入 的 ,例如 ,只 能 在 下 拉 选 择 框 内 选择 数据 时 。 
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在 这 个 例子 中 ,只 给 出 了 输入 变量 的 测试 值 。 为 了 完成 这 12 个 值 作 为 测试 输入 的 
测试 用 例 ,必须 通过 测试 准则 来 描述 测试 对 象 的 期 望 行为 和 期 望 输出 ,另外 需要 给 出 适 
用 的 前 置 条 件 和 后 置 条 件 。 

同样 ,还 需要 确定 测试 的 成 本 是 否 合理 .以 及 是 否 每 个 邻近 等 价 类 的 边界 值 都 需要 
额外 的 测试 用 例 ,丢弃 那些 包含 在 等 价 类 内 的 输入 值 却 不 能 验证 任何 边界 值 的 测试 用 
例 。 例 子 中 输入 值 为 一 123 和 654 的 测试 用 例 就 可 以 丢弃 。 这 是 基于 这 样 的 假设 : 包含 
在 等 价 类 之 内 的 数据 作为 测试 用 例 的 输入 进行 测试 ,并 不 会 发 现 什么 新 的 问题 。 因 为 在 
一 些 测 试用 例 中 ,已 经 选择 了 等 价 类 范围 之 内 的 最 大 值 和 最 小 值 作为 测试 输入 了 。 在 本 
例 中 这 些 值 是 MIN_INT 十 1.1 和 MAX_INT 一 1。 

但 是 在 上 面 提 到 的 旅行 者 的 例子 中 ,就 不 能 找到 输入 域 的 边界 值 。 旅 行者 的 例子 中 
输入 数据 类 型 是 不 连续 的 , 即 6 个 元 素 组 (儿童 ,青少年 ,成 年 人 ,学 生 , 残 疾 人 和 退休 人 
员 ) ,通过 年 龄 也 无 法 清楚 地 定义 顺序 ,例如 残疾 人 可 以 是 任何 年 龄 段 的 人 。 

当然 ,边界 值 分 析 技 术 也 可 以 应 用 在 输出 等 价 类 。 


2. 测试 用 例 


类 似 使 用 等 价 类 划分 技术 设计 测试 用 例 , 等 价 类 范围 内 的 有 效 边界 值 (在 边界 内 ) 也 
需要 在 测试 用 例 中 进行 组 合 。 而 无 效 边界 值 (在 边界 外 ) 需 要 分 开 进 行 验证 ,而 不 能 和 其 
他 的 无 效 边 界 值 进行 组 合 测试 。 

理论 上 ,假如 在 测试 用 例 中 已 经 应 用 到 了 等 价 类 内 的 两 个 边界 值 (例如 ,8 二 x 二 70， 
Zz 为 整 型 数 , 则 表示 9、10 或 69、70) , 则 处 于 此 等 价 类 内 部 的 那些 值 就 没有 必要 再 用 于 测 
试用 例 的 设计 。 

表 4-9 列 出 了 用 于 验证 函数 caculate_price( ) 有 效 等 价 类 的 边界 值 。 

表 4-9 函数 caculate_price() 参 数 边界 值 


参 数 小 于 下 限 的 值 [等 价 类 ] 大 于 上 限 的 值 
Baseprice 0—8®,[0,0+6,.…, MAX_DOUBLE—5, MAX_DOUBLE],MAX_DOUBLE 十 》 
Specialprice 同上 
Extraprice 同上 
一 lv [0,1,2],3 
Extras 2, [3,4],5 
4, [5,6,°%…, MAX_INT—1, MAX_INT], MAX_INT+1 
Discount 0—8,[0, 0+8,.*, 100—6,100],100+8 


只 考虑 有 效 等 价 类 范围 内 的 边界 值 , 可 以 得 到 4 十 4 十 4 十 9 十 4 二 25 个 边界 值 。 其 
中 ,两 个 值 (Extras: 1,3) 已 经 在 以 前 的 等 价 类 划分 技术 测试 用 例 中 覆盖 到 了 (测试 用 例 1 
和 用 例 2)。 因 此 ,下 面 的 23 个 代表 值 都 可 以 作为 候选 (假设 精度 为 小 数 点 后 2 位 ) ,用 来 


@ 考虑 的 精确 度 依赖 于 问题 本 身 ( 例 如 给 定 的 误差 ) 以 及 计算 机 的 数 制 (8 位 .16 位 .32 位 ,64 位 )。 
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设计 新 的 测试 用 例 。 

Baseprice: 0. 00,0.01,MAX_DOUBLE 一 0.01,MAX_DOUBLE; 

Specialprice: 0. 00,0.01,MAX_DOUBLE 一 0.01,MAX_DOUBLE; 

Extraprice: 0. 00,0. 01,MAX_DOUBLE 一 0.01,MAX_DOUBLE; 

Extras: 0,2,4,5,6,MAX_INT 一 1,MAX_INT; 

Discount: 0. 00,0. 01,99. 99,100. 00。 

所 有 的 这 些 值 都 是 有 效 的 边界 值 ,它们 可 以 通过 组 合 来 生成 测试 用 例 ( 如 表 4-10 
所 示 )。 


表 4-10 函数 caculate_price() 增 加 的 测试 用 例 


Test 参 数 
case Baseprice Specialprice Extraprice Extras |Discount Result 
15 0.00 0.00 0.00 0 0.00 0.00 
16 0.01 0.01 0.01 2 0.01 0.03 
MAX_DOUBLE | MAX_DOUBLE | MAX_DOUBLE 
17 4 99.99 | >MAX_DOUBLE 
一 0.01 一 0.01 一 0.01 
MAX_DOUBLE 
18 01 3450. 00 6000. 00 1 10. 00 二 MAX_DOUBLE 
MAX_DOUBLE 
19 20 000. 00 —0.01 6000. 00 1 10.00 二 MAX_DOUBLE 
MAX_DOUBLE 
20 20 000. 00 3450. 00 —0.01 1 10.00 二 MAX_DOUBLE 


从 说 明 中 确定 边界 值 测试 的 期 望 结 果 并 不 总 是 一 件 容 易 的 事情 。 因 此 ,需要 经 验 丰 
富 的 测试 人 员 定义 合理 的 期 望 结果 。 

(1) 测试 用 例 15 验证 了 函数 caculate_price() 所 有 参数 的 等 价 类 的 下 限 边 界 值 。 这 
个 测试 用 例 看 起 来 好 像 不 是 很 现实 。 因 为 功能 说 明 描 述 的 不 精确 ,没有 描述 下 限 和 上 限 
边界 值 。 

(2) 测试 用 例 16 类 似 于 测试 用 例 15, 但 这 里 测试 了 函数 计算 的 精确 性 。 

(3) 测试 用 例 17 集成 了 表 4-9 提供 的 下 一 个 边界 值 。 推 测 的 测试 期 望 结 果 是 折扣 
99.99%。 根 据 函 数 caculate_price() 的 说 明 , 其 中 的 价格 还 要 进行 累加 。 这 样 ,需要 单独 
检查 最 大 值 。 测 试用 例 18 一 测试 用 例 20 做 的 也 是 同样 的 工作 。 对 其 他 的 参数 ,使 用 了 
测试 用 例 1 中 的 数据 ( 表 4-7 所 示 )。 假 如 其 他 参数 的 数值 设 为 0. 00, 可 以 得 到 更 为 合理 
的 结果 ,用 来 判断 最 大 值 是 否 正确 地 得 到 处 理 并 且 没 有 溢出 。 

(4) 测试 用 例 17 一 20 ,对 测试 输出 结果 大 于 MAX_DOUBLE 的 情况 进行 了 测试 。 

(5) 对 于 还 没有 测试 到 的 边界 值 (Extras 二 5,6,MAX_INT 一 1,MAX_INT 和 
Discount 二 100. 00) ,需要 更 多 的 测试 用 例 来 覆盖 。 
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这 里 没有 涉及 有 效 等 价 类 范围 之 外 的 边界 值 。 

这 个 例子 说 明了 说 明 描述 不 准确 或 遗漏 会 直接 影响 测试 用 例 的 设计 。 假 如 测试 人 
员 在 确定 测试 用 例 之 前 和 客户 进行 有 效 沟通 ,或 者 说 明 中 对 参数 的 取 值 范围 描述 更 为 精 
确 , 这 样 将 会 提高 测试 的 质量 。 这 里 用 一 个 简单 的 例子 来 进行 说 明 。 

客户 给 出 了 下 面 的 一 些 信息 : 

(1) 基本 价 在 $10000~ $150000。 

(2) 特殊 设备 的 价格 为 $$800 一 $3500。 

(3) 最 多 可 有 25 个 可 能 的 附加 设备 Extras, 它 们 的 价格 在 $50 一 $750。 

(4) 经 销 商 给 出 的 最 大 折扣 为 25%。 

划分 了 等 价 类 之 后 ,可 以 得 到 如 下 的 有 效 边界 值 (精度 为 保留 小 数 点 后 2 位 )。 

Baseprice: 10000. 00,10000.01,149999. 99,150000. 00; 

Specialprice: 800. 00,800. 01,3499. 99,3500. 00; 

Extraprice: 50.00,50.01,18749.99,18750. 00; 

Extras: 0,1,2,3,4,5,6,24,25; 

Discount: 0.00,0.01,24.99,25.00。 

所 有 这 些 边界 值 都 可 以 自由 地 组 合 到 测试 用 例 中 。 对 于 在 有 效 等 价 类 之 外 的 值 ,还 
需要 有 测试 用 例 与 之 相对 应 ,下 面 的 数据 用 于 这 些 测试 用 例 。 

Baseprice: 9999. 99,150000.01; 

Specialprice: 799. 99,3500.01; 

Extraprice: 49.99,18750.01; 

Extras: —1,26; 

Discount: 一 0.01,25.01。 

因此 ,更 加 明确 地 说 明 可 以 降低 测试 用 例 的 个 数 ,同时 可 以 更 方便 地 确定 期 望 的 
结果 。 

增加 一 些 “ 硬 件 设备 的 边界 值 ”"(MAX_DOUBLE,MIN_DOUBLE 等 ) 是 一 个 不 错 的 
方法 , 它 可 以 发 现 一 些 由 于 硬件 限制 而 产生 的 问题 。 

就 像 上 面 的 讨论 ,测试 人 员 必 须 考虑 通过 两 个 测试 数据 来 测试 边界 值 (有 些 资 料 称 
为 二 元 边界 值 ) 是 否 已 经 充分 ,是 否 还 需要 测试 第 三 个 数据 (有 些 资料 称 为 三 元 边界 值 ) 。 
在 下 面 的 描述 中 ,假设 测试 两 个 数据 就 足够 了 ,因为 已 经 通过 了 代码 评审 ,并 且 发 现 了 所 
有 可 能 的 错误 。 

(1) 对 于 一 个 输入 域 ,必须 考虑 边界 值 和 处 于 输入 域 之 外 的 邻近 值 。 例 如 输入 域 为 
[一 1.0, 十 1.0] ,测试 数据 为 一 1. 0 十 1.0 和 一 1.1、 十 1. 1。 

(2) 若 测试 的 输入 是 一 组 序列 范围 ,输入 数据 的 个 数 又 是 已 知 的 , 则 可 以 根据 下 面 的 
方法 考虑 边界 值 。 例 如 一 个 文件 的 数据 个 数 在 1 一 100 ,测试 数据 (数据 个 数 ) 应 该 是 1、 
100 和 0、101。 

(3) 若 分 析 的 对 象 是 输出 域 ,可 以 按照 下 面 的 规则 进行 分 析 。 测 试 对 象 的 输出 是 整 
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型 值 ,范围 为 500 一 1000。 得 到 的 测试 输出 应 该 是 500、1000、499 和 1001。 实 际 上 ,需要 
花费 一 定 的 工作 量 来 标识 得 到 相应 输出 的 每 个 输入 值 。 产 生 无 效 的 输出 有 时 可 能 是 不 
现实 的 ,但 也 许 能 发 现 一 些 与 输入 值 相关 的 缺陷 。 

(4) 若 测试 的 输出 是 一 组 序列 范围 , 则 处 理 的 方式 和 处 理 测试 输入 值 是 一 组 序列 范 
围 的 情况 是 一 样 的 。 例 如 输出 值 允许 的 范围 是 1 一 4 ,测试 需要 产生 的 输出 值 是 1.4 以 及 
0 和 5。 对 于 一 组 有 序 的 组 合 , 测 试 特 别 感 兴趣 的 元 素 是 第 一 个 和 最 后 一 个 。 

(5) 若是 复杂 的 数据 结构 作为 输入 或 输出 ,例如 ,一 个 空 的 列表 或 0 矩阵 可 以 作为 边 
界 值 。 

(6) 对 于 无 效 等 价 类 ,只 有 当 无 效 等 价 类 内 的 值 可 以 触发 测试 对 象 一 个 不 同 的 异常 
处 理 时 ,进行 边界 值 的 分 析 才 是 有 意义 的 。 

(7) 应 该 选择 非常 庞大 的 数据 结构 ,列表 和 表格 等 作为 边界 值 分 析 的 数据 ,例如 那些 
能 使 内 存 溢出 文件 和 数据 存储 到 达 饱 和 的 边界 ,来 检查 测试 对 象 在 这 种 情形 下 的 表现 
行为 。 

(8) 对 于 列表 和 表格 , 空 的 列表 和 满 的 列表 以 及 列表 的 第 一 个 元 素 和 最 后 一 个 元 素 
都 是 应 该 分 析 的 对 象 , 因 为 测试 它们 常常 可 以 发 现 由 于 错误 的 编程 而 导致 的 失效 。 


3. 边界 值 覆 盖 率 计算 


类 似 于 等 价 类 覆盖 率 ,边界 值 (BV) 的 覆盖 率 也 可 以 预先 定义 ,并 在 设计 测试 用 例 以 
及 执行 测试 时 对 获 盖 率 进行 计算 。 
边界 值 禾 盖 率 二 (已 获 盖 的 边界 值 数目 /总 的 边界 值 数 目 ) X100% 
注意 : 边界 值 的 数目 ,必须 考虑 边界 值 上 限 的 邻近 数值 和 下 限 的 邻近 数值 的 数目 。 
当然 ,具体 的 数目 只 包含 数值 不 相等 的 输入 值 。 对 于 邻近 等 价 类 的 重 倒 的 数据 只 能 作为 
一 个 边界 值 ,因为 对 于 每 个 测试 数据 ,都 只 有 一 个 测试 用 例 与 之 相对 应 。 


4. 边界 值 分 析 技 术 的 优 缺 点 分 析 


边界 值 分 析 应 该 和 等 价 类 划分 一 起 使 用 ,因为 在 等 价 类 边界 值 上 发 现 问题 的 概率 比 在 
等 价 类 内 部 发 现 问题 的 概率 高 得 多 ,边界 值 分 析 技术 往往 作为 等 价 类 划分 技术 的 有 效 补 
充 。 这 两 种 技术 经 常 相互 结合 使 用 ,同时 在 选择 具体 的 测试 数据 时 可 以 保持 足够 的 独立 性 。 

利用 边界 值 分 析 技 术 来 定义 相应 的 测试 用 例 需 要 很 多 的 创造 性 ,这 点 经 常会 被 忽 
略 。 这 个 技术 看 起 来 似乎 很 简单 ,而 实际 使 用 时 需要 确定 相关 的 边界 值 , 而 这 根本 不 是 
想象 中 的 那么 简单 和 轻松 。 


4.3.3 决策 表 测 试 


1. 决策 表 和 因果 图 介绍 
等 价 类 划分 和 边界 值 分 析 是 非常 有 用 的 黑 盒 测试 技术 ,在 设计 测试 用 例 过 程 中 借助 
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于 这 两 种 技术 能 有 效 选择 测试 数据 ,大 大 提高 测试 的 效率 。 但 在 很 多 情况 下 ,不 仅 要 考 
虑 测试 的 输入 数据 ,还 要 对 系统 的 业务 逻辑 进行 测试 验证 ,而 这 些 业务 逻辑 往往 又 是 比 
较 复 杂 的 。 另 外 , 当 系统 的 输入 参数 不 独立 ,参数 间 有 复杂 的 逻辑 关系 时 ,使 用 等 价 类 划 
分 和 边界 值 分 析 就 会 变 得 比较 困难 。 在 这 些 情况 下 ,可 以 考虑 利用 决策 表 或 因果 图 技术 
来 设计 测试 用 例 。 

决策 表 或 因果 图 是 通过 分 析 说 明 ,识别 出 系统 可 能 的 条 件 和 行为 ,并 最 终 设计 测试 
用 例 的 技术 。 如 果 使 用 表格 的 形式 表达 这 些 条 件 的 各 种 组 合 关系 ,和 在 每 一 种 特定 的 条 
件 组 合 下 应 该 发 生 的 行为 , 则 称 为 决策 表 技术 。 如 果 使 用 的 是 布尔 图 (因果 图 ) 来 描述 这 
些 关 系 , 则 称 为 因果 图 技术 。 决 策 表 和 因果 图 之 间 可 以 相互 进行 转换 ,测试 人 员 可 以 根 
据 习惯 或 掌握 的 程度 选择 使 用 决策 表 或 因果 图 。 

决策 表 由 4 个 部 分 组 成 ,分 别 是 条 件 桩 (Condition Stub) ,动作 桩 (Action Stub) 、 条 
件 项 (Condition Entry) 组 合 和 动作 项 (Action Entry) 组 合 ,具体 格式 如 表 4-11 所 示 。? 
决策 表 的 4 个 组 成 部 分 的 含义 如 下 。 

(1) 条 件 桩 : 列 出 了 测试 对 象 的 所 有 条 件 。 一 般 情 况 下 , 列 出 的 条 件 的 次 序 不 会 影 
响 测试 对 象 的 动作 。 

(2) 动作 桩 : 列 出 了 测试 对 象 所 有 可 能 执行 的 操作 。 一 般 情况 下 ,这 些 执行 的 操作 
没有 先后 顺序 的 约束 。 

(3) 条 件 项 组 合 : 列 出 针对 特定 条 件 的 取 值 的 组 合 , 即 条 件 的 真 假 值 。 每 一 列 条 件 
值 的 组 合 形成 一 个 规则 。 

(4) 动作 项 组 合 : 列 出 在 不 同 条 件 项 的 各 种 取 值 组 合 情 况 下 (规则 ) ,测试 对 象 应 该 
执行 的 动作 的 组 合 。 

表 4-11 决策 表格 式 示例 

规则 1 规则 2 | 台风 


条 件 1 
条 件 2 


条 件 桩 


条 件 m 
动作 1 
动作 2 


动作 桩 


动作 n 


其 中 条 件 桩 中 的 条 件 1、 条 件 2 和 条 件 疡 ,表示 测试 对 象 的 各 种 输入 条 件 。 动 作 桩 中 
的 动作 1 ,动作 2 和 动作 ,表示 测试 对 象 根据 不 同 输入 条 件 的 组 合 需 要 执行 的 操作 ; 规 
则 1 规则 2 到 规则 p 中 的 每 一 个 规则 定义 了 在 一 组 条 件 ( 条 件 1, 条 件 2 和 条 件 m) 的 组 


DD UDOW. POOCH,Translation of Decision Tables,Computing Surveys, Vol. 6, No. 2, June 1974. 
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合 , 只 有 同时 满足 了 一 组 条 件 所 定义 的 组 合 ,才能 说 满足 了 某 个 规则 ; 当 满足 了 某 个 规则 
后 , 则 测试 对 象 执行 与 此 规则 所 对 应 的 动作 序列 , 即 动作 1, 动作 2 和 动作 的 组 合 。 如 
有 m 个 条 件 , 则 最 多 有 P 二 2" 条 规则 。 需 要 注意 的 是 : 通常 来 说 ,测试 对 象 执行 的 操 
作 , 和 条 件 的 顺序 没有 关系 ,而 仅仅 依赖 于 它们 的 取 值 。 同 样 ,测试 对 象 执 行 的 操作 仅仅 
依赖 于 特定 的 条 件 组 合 ,而 与 其 他 测试 输入 或 者 测试 对 象 状态 无 关 。 

决策 表 的 测试 覆盖 标准 通常 是 每 条 规则 至 少 对 应 一 个 测试 用 例 ,用 于 获 盖 触发 条 件 
的 组 合 。 决 策 表 测试 的 优点 是 可 以 生成 测试 需求 的 各 种 组 合 , 而 一 般 测试 方法 很 难 全 部 
和 覆盖 到 各 种 组 合 。 

下 面 通过 在 ATM 机 中 取 钱 的 例子 来 描述 如 何 设计 决策 表 。 通 过 阅读 说 明 得 知 : 如 
果 使 用 的 银行 卡 是 无 效 的 , 则 ATM 机 拒绝 此 卡 ,不 提供 任何 服务 。 如 果 使 用 的 银行 卡 有 
效 ,ATM 机 会 要 求 客 户 输入 密码 ,如 果 客 户 输入 了 错误 密码 ,并 且 客户 还 没有 达到 连续 
三 次 输入 错误 密码 , 则 ATM 会 要 求 客户 再 次 输入 密码 。 但 是 如 果 客 户 已 经 连续 三 次 输 
入 错误 密码 , 则 ATM 机 将 会 吞食 此 卡 (不 退 卡 )。 如 果 使 用 的 银行 卡 有 效 ,客户 也 输入 了 
正确 密码 ,ATM 机 要 求 客户 输入 所 想 要 取款 的 金额 ,如 果 客 户 输入 的 金额 大 于 ATM 机 
内 当前 所 拥有 的 金额 ,或 客户 输入 的 金额 大 于 此 客户 银行 账户 上 所 存 的 金额 , 则 ATM 机 
会 显示 提示 信息 ,告知 客户 输入 的 金额 无 效 , 要 求 客户 重新 输入 金额 。 只 有 当 客 户 输入 
的 金额 少 于 或 等 于 ATM 机 内 当前 所 拥有 的 金额 ,并 且 也 少 于 或 等 于 此 客户 银行 账户 上 
所 存 的 金额 , 则 输入 的 金额 有 效 ,ATM 机 如 数 输出 金额 。 

分 析 上 述 描述 ,可 能 的 条 件 包括 如 下 几 个 。 

Cl: 银行 卡 有 效 ? 

C2: 正确 输入 了 PIN? 

C3: 已 经 是 第 三 次 输入 PIN? 

C4: 金额 有 效 ? (ATM 机 中 有 足够 的 钱 ,并 且 此 账号 中 也 存 有 足够 的 钱 ) 

AMT 机 可 能 的 反应 (动作 ) 包 括 如 下 几 种 。 

Al: 拒绝 此 卡 。 

A2: 请 求 再 一 次 输入 PIN。 

A3: 知 卡 。 

A4: 要 求 重新 输入 金额 。 

A5: ATM 机 输出 要 求 的 现金 。 

生成 的 决策 表 如 表 4-12 所 示 。 


表 4-12 ATM 取款 的 初始 决策 表 


规则 


cl 
C2 
C3 
C4 


贷 妄 浴 
中 < = 
莹 | < < es 
中 | 莹 |<| < we 
Zizixl< *» 
xxizl< a 
zixlzl<lo 
xzlzlx<|~ 
APACAPIES 
<ixix|lzle 
Zixix|z 
xzix|z 
Zizixlz 
中 < 了 | 二 
zixlzlz 
“zizlz 
Zizizlz 
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续 表 
规则 |1|12|13|14|15|16|7|8|9|10|11|12|13|14|15| 16 
Al EE 
动 | A2 wl 
作 | A3 至 小 到 
桩 | A4 于 入 
A5 | 立 这 


检查 初始 决策 表 ( 如 表 4-12 所 示 ) 可 以 发 现 有 的 动作 对 应 一 个 规则 ,而 有 的 动作 有 多 
个 规则 可 以 对 应 。 因 此 ,需要 对 初始 的 决策 表 进 行 优化 ,将 具有 相同 的 动作 并 且 条 件 项 
之 间 存 在 相似 关系 的 规则 进行 合并 ,相关 条 件 项 置 为 “不 关心 ”, 用 一 表示 。 例 如 ,观察 规 
则 9 规则 16, 当 条 件 C1 为 假 的 时 候 ,无 论 条 件 C2、C3 和 C4 取 什 么 值 ,对 应 的 动作 都 是 
Al, 这 就 意味 着 规则 9 一 规则 16 可 以 合并 成 一 条 新 的 规则 (如 表 4-13 中 的 新 规则 5)。 
同样 ,可 以 合并 表 4-12 中 的 规则 1 与 3 到 表 4-13 内 的 新 规则 1, 合 并 表 4-12 中 的 规则 2 
与 4 到 表 4-13 内 的 新 规则 2, 合 并 表 4-12 中 的 规则 5 与 6 到 表 4-13 内 的 新 规则 3, 合 并 
表 4-12 中 的 规则 7 与 8 到 表 4-13 内 的 新 规则 4。 在 考虑 合并 过 程 中 ,不 仅 要 考虑 条 件 的 
组 合 ,还 要 考虑 动作 的 一 致 性 。 对 初始 决策 表 (如 表 4-12 所 示 ) 中 不 相干 或 者 宛 余 的 条 件 
组 合 进行 优化 ,得 到 优化 之 后 的 决策 表 , 如 表 4-13 所 示 。 


表 4-13 ATM 取款 的 优化 决策 表 


新 规 则 1 2 4 5 
Cl: 银行 卡 有 效 ? 到 入 TY Y N 
C2: 正确 地 输入 密码 ? 人 于 N N 一 
条 作 柱 C3+ 三 次 不 正确 的 密码 ? | 
C4: 银行 卡 账号 中 有 钱 ? 和 N 一 一 一 
Al: 拒绝 银行 卡 EE 
A2: 要 求 新 的 密码 输入 Y 
动作 桩 A3: 知 卡 Y 
A4: 询问 新 的 金额 ¥ 
A5: ATM 出 币 党 


基于 决策 表 技术 设计 测试 用 例 的 目的 是 执行 让 人 感 兴趣 的 输入 组 合 ,主要 是 指 可 能 
发 现 问题 的 输入 组 合 。 除 了 原因 和 结果 外 ,决策 表 中 也 可 能 包含 中 间 结 果 。 至 少 考虑 为 
每 一 列 的 规则 设计 一 个 测试 用 例 , 条 件 作 为 测试 用 例 的 输入 ,动作 则 是 测试 用 例 的 预期 
输出 。 然 而 ,决策 表 中 的 条 件 可 能 存在 相互 影响 或 者 相互 排斥 ,因此 并 不 是 所 有 的 组 合 
都 是 有 效 的 。 决 策 表 中 的 条 件 /原因 和 动作 /结果 ,通常 以 “是 /Y” 和 * 否 /N” 的 方式 出 现 。 

在 ATM 的 例子 中 有 4 个 条 件 ( 从 “银行 卡 是 有 效 的 ”到 “金额 有 效 (ATM 机 中 有 足 
够 的 钱 ,并 且 账户 中 也 有 足够 的 钱 )”) ,理论 上 可 以 有 16(2*) 种 可 能 的 组 合 。 但 是 ,由 于 
决策 表 中 有 些 条 件 的 取 值 ,会 影响 其 他 条 件 , 例 如若 银 行 卡 是 无 效 的 ,那么 判断 其 他 条 件 
就 不 再 有 意义 。 另 外 ,在 优化 的 决策 表 内 已 经 删除 一 些 无 法 实现 或 不 符合 逻辑 的 条 件 组 
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合 。 所 以 ,优化 得 到 的 决策 表 并 不 一 定 是 所 有 条 件 的 完全 组 合 。 

基于 优化 之 后 的 决策 表 , 可 以 为 每 列 设计 一 个 测试 用 例 , 并 确定 所 需 的 输入 条 件 和 
期 望 的 行为 。 例 如 ,测试 用 例 1( 规 则 1) 覆 盖 了 下 面 的 条 件 组 合 : 在 银行 卡 是 有 效 的 ,并 
且 输入 的 PIN 是 正确 的 以 及 ATM 机 和 银行 卡 中 都 有 足够 的 钱 的 情况 下 ,得 到 的 期 望 结 
果 应 该 是 ATM 可 以 输出 现金 。 

除了 通过 表格 的 方式 表示 条 件 \ 行 为 ,以 及 它们 的 组 合 之 外 ,也 可 以 通过 布尔 图 ( 因 
果 图 ) 来 描述 这 种 关系 ,这 就 是 因果 图 法 。 被 测 对 象 中 的 原因 (条 件 ) 和 结果 (行为 ) 之 间 
的 逻辑 关系 在 因果 图 中 用 人 逻辑 描述 方法 清楚 表达 了 出 来 。 因 果 图 中 的 结果 (或 中 间 结 
果 ) 是 由 原因 间 的 逻辑 运算 ,例如 恒 等 、 与 或 . 非 等 组 合 而 成 的 。 因 果 图 中 的 原因 取 值 是 
真 或 者 假 ,类 似 于 决策 表 进行 处 理 , 得 到 不 同 的 结果 。 

图 4-1 以 因果 图 的 方式 ,描述 了 ATM 机 中 取 钱 的 例子 。 


图 例 : 个 非 


逻辑 与 
4 


图 4-1 ATM 因果 图 


因果 图 清楚 地 描述 了 为 得 到 相应 的 结果 ( 果 ) ,需要 组 合 什么 样 的 条 件 ( 因 )。 除 了 原 
因 和 结果 外 ,因果 图 中 也 可 能 包含 中 间 结 果 。 一 般 很 难 直 接 从 因果 图 导出 测试 用 例 , 常 
用 的 方法 是 首先 将 因果 图 转换 成 决策 表 , 再 从 决策 表 得 到 相应 的 测试 用 例 。 将 因果 图 转 
换 为 决策 表 的 步骤 如 下 。 

(1) 选择 结果 。 

(2) 根据 因果 图 ,查找 能 够 得 到 这 个 结果 的 原因 组 合 ,以 及 不 产生 这 种 结果 的 原因 
组 合 。 

(3) 在 决策 表 中 为 每 一 个 原因 的 组 合 ,以 及 引起 这 个 结果 的 状态 添加 一 列 。 

(4) 检查 决策 表 条 目 是 否 出 现 宛 余 , 并 删除 宛 余 的 条 目 。 


第 4 章 ”测试 设计 技术 eu07 


将 ATM 因果 图 转换 成 的 决策 表 如 表 4-13 所 示 。 
2. 测试 用 例 


通过 决策 表 可 以 清楚 地 看 到 输入 条 件 之 间 的 相互 关系 ,以 及 由 这 些 输入 条 件 组 合 得 
到 的 相应 的 输出 。 针 对 决策 表 的 每 一 列 至 少 可 以 设计 一 个 测试 用 例 。 通 过 决策 表 的 规 
则 得 到 的 是 逻辑 测试 用 例 。 为 了 执行 这 些 测 试用 例 ,还 必须 确定 具体 的 数据 ,以 及 标识 
前 置 条 件 和 后 置 条 件 。 因 此 ,在 决策 表 测 试 中 还 应 该 结合 其 他 的 黑 盒 测 试 技术 ,如 等 价 
类 划分 技术 和 边界 值 分 析 技术 ,以 帮助 选择 输入 条 件 的 具体 数据 。 


3. 决策 表 或 因果 图 技术 的 覆盖 率 计算 


和 前 面 介绍 的 方法 一 样 ,可 以 清晰 地 定义 决策 表 的 覆盖 率 。 最 基本 的 要 求 是 每 一 个 
规则 至 少 用 一 个 测试 用 例 来 覆盖 ,这样 就 验证 了 所 有 关心 的 输入 条 件 组 合 和 相应 的 输出 
结果 。 

决策 表 履 盖 率 二 (已 获 盖 的 规则 数 /总 的 规则 数 ) X100% 


4. 决策 表 技 术 优 缺点 分 析 


决策 表 技 术 将 各 种 输入 条 件 的 组 合 ,以 及 它们 的 行为 生成 决策 表 , 是 一 种 系统 化 而 
且 非 常 正式 的 方法 , 它 可 以 覆盖 一 些 在 其 他 测试 设计 技术 中 没有 包含 的 输入 组 合 。 

但 是 , 随 着 被 测 对 象 条 件数 目的 增加 ,得 到 的 决策 表 和 因果 图 的 规模 会 急剧 变 大 ,不 
仅 失 去 可 读 性 ,并 且 变 得 难以 处 理 。 


4.3.4 状态 转换 测试 


状态 转换 图 (简称 状态 图 ) 通 过 描绘 系统 的 “状态 ”及 引起 系统 “状态 转换 ”的 “事件 ”， 
来 表示 系统 的 行为 。 此 外 状态 转换 图 还 指明 了 作为 特定 事件 的 结果 ,系统 将 做 哪些 “ 动 
作 ”( 例 如 处 理 数据 )。 因 此 状态 转换 图 提供 了 行为 建 模 机 制 。 

在 状态 转换 图 中 ,每 一 个 节点 代表 一 个 状态 ,至 少 有 一 个 开始 状态 。 其 中 双 圈 是 终 
结 状态 ,在 状态 转换 图 中 终结 状态 不 是 必需 的 。 从 一 个 状态 到 另 一 状态 (也 可 以 是 同一 
状态 ) 的 状态 转换 是 用 连接 此 状态 的 有 向 边 来 表示 的 ,在 有 向 边 上 同时 标记 引起 此 状态 
转换 的 事件 ,以 及 由 此 事件 引发 状态 转换 后 的 动作 。 标 记 如 “事件 /动作 ”, 在 标记 中 事件 
是 必需 的 ,但 动作 可 有 可 无 。 

状态 转换 测试 指 的 是 所 设计 的 测试 用 例 用 来 执行 有 效 和 无 效 的 状态 转换 的 一 种 黑 
盒 测试 设计 技术 。 在 很 多 情况 下 ,测试 对 象 的 输出 和 行为 方式 不 仅 受 当前 输入 数据 的 影 
响 , 同 时 还 和 测试 对 象 之 前 的 状态 有 关 。 状 态 转换 图 是 进行 相关 状态 转换 测试 设计 的 
基础 。 

如 图 4-2 所 示 是 一 个 典型 的 堆栈 例子 ,通过 这 个 例子 可 以 详细 说 明 状 态 转 换 测试 的 
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过 程 。 堆 栈 可 以 假设 是 餐 盘 的 加 热 器 ,只 能 从 餐 盘 加 热 器 顶端 的 出 入 口 放 入 和 餐 盘 或 取出 
餐 盘 ,最 先 放 和 的 餐 盘 总 是 最 后 被 取出 。 堆 栈 有 三 种 不 同 的 状态 : 空 (empty) , 非 空 


(filled) 和 满 (full) 。 
top 
pop[height>1] push* 

push[height<Max-1] top 

push 

push [height=Max—1] 

filled full 

pop[height=1] pop 


开始 状态 
结束 状态 


转换 


图 4-2 堆栈 的 状态 转换 图 


堆栈 初始 化 以 后 处 于 “ 空 ”状态 ,此 时 的 高 度 等 于 0, 并且 定义 了 堆栈 的 最 大 高 度 
Max。 堆 栈 中 加 入 一 个 元 素 (通过 调用 函数 push) ,堆栈 的 状态 转换 为 “ 非 空 ”, 同 时 当前 
的 高 度 相应 增加 1。 堆 栈 处 于 这 个 状态 时 ,元 素 可 以 继续 增加 (调用 函数 push, 高 度 也 继 
续 增加 ) ,也 可 以 移 除 堆 栈 中 的 元 素 ( 调 用 函数 pop, 高 度 的 值 减 少 1)。 可 以 显示 当前 堆 
栈 内 最 上 面 的 元 素 内 容 ( 调 用 函数 top, 高 度 值 不 变 ), 这 里 的 显示 (调用 函数 top) 并 没有 
改变 和 影响 堆栈 本 身 ,没有 从 堆栈 内 移 除 元 素 。 假 如 当前 的 高 度 值 比 允许 的 最 大 值 小 1 
(高 度 值 = Max 一 1) ,这 时 堆栈 中 再 加 入 一 个 元 素 ( 调 用 函数 push) ,堆栈 的 状态 将 从 * 非 
空转 换 到 * 满 ”状态 ,堆栈 中 不 能 再 加 入 任何 新 的 元 素 。 在 堆栈 状态 为 * 满 *? 时 ,从 堆栈 中 
移 除 一 个 元 素 (调用 函数 pop) ,堆栈 的 状态 将 从 “ 满 ”转换 到 “ 非 空 ”。 当 堆栈 中 只 有 一 个 
元 素 ,这 个 唯一 的 元 素 被 移 除 以 后 (调用 函数 pop) ,堆栈 的 状态 将 从 “ 非 空 "转换 到 “ 空 ”。 
堆栈 只 有 在 “ 空 ”状态 下 才能 被 删除 (调用 函数 delete) 。 

根据 说 明 可 以 确定 堆栈 在 什么 样 的 状态 下 调用 什么 样 的 函数 (push, pop,top，…)， 
同时 必须 明确 当 一 个 元 素 加 入 到 状态 为 “ 满 * 的 堆栈 中 时 ,堆栈 会 怎样 来 处 理 (push * )， 
此 时 函数 的 功能 肯定 和 处 于 “ 非 空 ”状态 时 不 一 样 。 因 此 ,函数 必须 根据 堆栈 的 状态 提供 
不 同 的 功能 。 这 里 ,测试 对 象 的 状态 起 着 决定 性 的 作用 ,因此 在 测试 时 必须 考虑 相应 的 


状态 和 状态 转换 。 
例如 ,测试 堆栈 可 以 接受 的 是 字符 类 型 。 下 面 是 包含 前 置 条 件 和 后 置 条 件 的 一 个 测 
试用 例 。 


(1) 前 置 条 件 : 堆栈 已 初始 化 ,状态 为 * 空 ”(empty) 。 
(2) 输入 : push(“hello”)。 
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(3) 期 望 结 果 : 堆栈 中 包含 了 “hello”。 

(4) 后 置 条 件 : 堆栈 的 状态 变 为 “ 非 空 ”(filled)。 

在 这 个 例子 中 还 没有 考虑 堆栈 的 一 些 其 他 函数 (例如 显示 堆栈 当前 的 高 度 值 ,显示 
堆栈 的 最 大 高 度 值 ,查询 堆栈 是 否 处 于 * 空 ?状态 等 ) ,这 些 函 数 的 调用 并 不 会 改变 堆栈 的 

状态 转换 测试 中 ,测试 对 象 既 可 以 是 具有 不 同系 统 状 态 的 完整 系统 ,也 可 以 是 面向 
对 象 的 系统 (Object-oriented System) 中 具有 不 同 状态 的 类 。 假 如 由 于 历史 的 原因 导致 
系统 不 同 的 表现 ,状态 转换 测试 就 是 一 种 可 以 选择 的 潜在 的 测试 设计 技术 。 

状态 转换 测试 可 以 根据 覆盖 率 要 求 的 不 同 ,定义 不 同 的 测试 强度 ,例如 覆盖 所 有 可 
能 的 状态 。 在 上 面 提 到 的 堆栈 的 例子 中 ,被 测 系统 的 状态 包括 * 空 ”,“ 非 空 " 和 “ 满 "。 假 
如 该 堆栈 定义 的 最 大 高 度 为 4(Max 一 4), 通 过 调用 下 面 的 函数 就 可 以 敢 盖 到 这 三 个 

测试 用 例 1: 初始 化 [ 空 ],push[ 非 空 ],push[ 非 空 ],push[ 非 空 ],push[ 满 ]。 在 这 个 
测试 用 例 中 ,并 没有 调用 到 堆栈 的 所 有 函数 。 

另外 一 种 测试 强度 要 求 调用 所 有 的 事件 (这 里 是 函数 )。 和 前 面谈 到 的 堆栈 一 样 ,只 
要 调用 下 面 这 一 系列 函数 就 可 以 满足 这 个 需求 。 

测试 用 例 2: 初始 化 [ 空 ],push[ 非 空 ],top[ 非 空 ],pop[ 空 ],delete。 然 而 ,按照 这 一 
函数 系列 执行 ,并 没有 获 盖 堆栈 的 所 有 状态 。 

针对 每 个 状态 ,状态 转换 测试 应 该 将 与 此 状态 相关 的 函数 至 少 都 执行 一 遍 , 并 比较 
实际 结果 与 期 望 结 果 , 以 判断 是 否 满足 文档 中 描述 的 要 求 。 

由 于 状态 转换 图 中 可 能 存在 循环 的 回路 ,为 了 方便 设计 测试 用 例 ,需要 将 状态 转 
换 图 转变 为 只 包含 特定 转换 顺序 的 状态 转换 树 (一 棵 倒 长 的 树 , 根 在 最 上 方 ), 即 将 可 
能 具有 无 限 多 状态 序列 的 循环 的 状态 转换 图 转化 为 状态 转换 树 。 一 棵 完整 的 状态 转 
换 树 的 终结 点 (没有 后 续 子 节点 ) 称 为 叶 节点 , 除 叶 节 点 外 的 其 他 节点 称 为 内 部 节点 ， 
连接 这 些 节点 的 是 枝 干 ,在 树 内 不 再 有 任何 的 循环 。 状 态 转换 树 的 节点 对 应 状态 转换 
图 内 的 状态 ,状态 转换 树 内 连接 这 些 节 点 的 枝 干 以 及 枝 干 的 标注 代表 转换 图 内 从 一 个 
状态 到 男 一 个 状态 的 转换 ,以 及 触发 此 转换 的 事件 (函数 调用 、 鼠 标 单 击 等 )。 在 将 状 
态 转 换 图 转变 成 状态 转换 树 后 ,再 从 状态 转换 树 系 统 化 开发 出 相应 的 测试 用 例 , 不 仅 
能 覆盖 状态 转换 图 内 的 所 有 状态 ,而 且 还 考虑 到 了 状态 转换 图 内 的 所 有 状态 转换 
过 程 。 

下 面 是 将 状态 转换 图 转化 为 状态 转换 树 的 规则 。 

(1) 状态 转换 树 的 根 节 点 就 是 状态 转换 图 的 初始 状态 或 开始 状态 (在 状态 转换 图 中 ， 
初始 状态 或 开始 状态 是 必须 有 的 ) 。 

(2) 找 出 状态 转换 树 的 终 节点 (暂时 还 没有 后 续 子 节点 ) 并 且 也 不 是 叶 节 点 的 节点 ， 
在 状态 转换 图 内 找到 对 应 此 节点 的 状态 ,在 状态 转换 树 内 增加 在 此 状态 通过 不 同 触发 事 
件 引发 的 所 有 状态 转换 (直接 转换 )。 在 状态 转换 树 内 在 此 节点 下 加 入 一 个 枝 干 表示 一 
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个 转换 , 枝 干 边 的 标识 表示 为 引起 这 个 转换 的 触发 事件 ,在 此 枝 干 下 新 增 的 节点 表示 从 
此 状态 转换 后 所 到 达 的 (直接 ) 后 续 状态 。 

(3) 对 状态 转换 树 的 每 个 新 增 节点 都 做 如 下 检查 。 

@ 如 果 在 状态 转换 树 内 新 增 节点 所 对 应 的 状态 转换 图 的 状态 是 结束 状态 , 则 状态 转 
换 树 内 此 新 增 节 点 标识 为 叶 节点 。 

@ 如 果 新 增 节点 已 经 出 现在 状态 树 ,与 该 节点 同 级 或 者 上 一 级 中 , 且 是 以 非 叶 节点 
状态 存在 的 , 则 状态 转换 树 中 此 新 增 节点 标识 为 叶 节点 。 

(4) 检查 状态 转换 树 ,如 果 所 有 的 终 节点 都 已 经 是 叶 节 点 , 则 结束 状态 转换 树 ,否则 
重复 步 又 (2) 。 

对 于 堆栈 这 个 例子 ,从 状态 转换 图 中 得 到 的 状态 转换 树 如 图 4-3 所 示 。 


push 
[height=Max-1] 


开始 状态 
结束 状态 
状态 
转换 


图 4-3 堆栈 的 状态 转换 树 


可 以 从 状态 转换 树 系统 化 地 设计 出 测试 用 例 , 按 这 种 方法 设计 出 的 测试 用 例 不 仅 能 
覆盖 所 有 的 状态 ,而 且 还 考虑 到 了 所 有 可 能 的 触发 事件 (函数 调用 或 鼠标 单 击 ) 和 状态 转 
换 。 从 状态 转换 树 到 测试 用 例 的 过 程 也 比较 简单 ,只 要 考虑 从 树 的 根 节点 到 每 个 叶 节 点 
的 每 一 条 路 径 都 至 少 设计 出 一 个 测试 用 例 加 以 覆盖 即 可 。 在 堆栈 的 例子 中 ,从 状态 转换 
树 的 根 节点 到 最 后 的 叶 节点 ,总共 可 以 产生 8 条 不 同 的 路 径 ( 共 有 8 个 叶 节 点 ) ,每 个 路 
径 代 表 了 一 个 测试 用 例 , 即 由 一 系列 的 函数 调用 ,例如 ,其 中 的 一 个 测试 用 例 为 : 从 开始 
状态 调用 函数 initialize 后 ,系统 应 该 进入 empty 状态 ,然后 再 调用 函数 push, 系 统 应 该 进 
入 filled 状态 ,然后 再 调用 函数 pop [height 二 1] 函 数 ,这 时 系统 应 该 进入 empty 状态 。 

此 外 ,还 需要 检查 状态 转换 图 中 对 调用 错误 函数 的 处 理 , 即 在 某 个 状态 上 调用 了 不 
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该 调用 的 函数 (例如 在 * 满 ?状态 时 调用 删除 堆栈 函数 ) ,这 是 一 个 健壮 性 测试 ,来 验证 测 
试 对象 对 不 正确 的 调用 是 如 何 处 理 的 ,用 来 测试 是 否 会 出 现 不 应 该 出 现 的 状态 转换 , 甚 
至 造成 宕 机 ,这 种 类 型 的 测试 类 似 于 输入 异常 数值 的 测试 ,如 图 4-4 所 示 。 


图 4-4 包含 健壮 性 测试 的 状态 转换 树 


状态 转换 测试 可 以 应 用 于 系统 测试 。 例 如 ,可 以 用 来 设计 图 形 用 户 界面 GUI 的 测试 。 
图 形 用 户 界面 通常 是 指 采用 图 形 方式 显示 的 计算 机 操作 用 户 界 面 ,可 以 通过 窗口 菜单, 按 
钮 等 方式 来 方便 地 进行 操作 。 例 如 Window 系统 ,用 户 使 用 鼠标 单 击 屏幕 上 相应 的 元 素 
(图 标 、 按 钮 等 ) 就 可 以 进入 相应 操作 (如 进入 MS Word) 。 假 如 把 屏幕 上 的 窗口 和 控件 看 
成 是 状态 ,对 输入 的 处 理 看 成 是 状态 转换 ,图 形 用 户 界 面 就 可 以 描述 成 状态 转换 图 。 通 
过 上 面 介绍 的 状态 转换 测试 技术 ,就 可 以 获得 相应 的 测试 用 例 ,达到 相应 的 测试 覆盖 率 。 

如 图 4-5 所 示 的 是 DreamCar 软件 的 图 形 界面 。 测 试 从 DreamCar 的 主屏 幕 开始 ( 状 
态 1) ,用 鼠标 单 击 Setup Vehicles 后 触发 状态 转换 到 对 话 框 Edit vehicle( 状 态 2) 。 再 用 鼠 
标 单 击 Cancel 后 结束 对 话 框 并 且 返 回 到 主屏 幕 (状态 1) 。 在 一 个 状态 内 ,可 以 进行 一 些 不 
改变 状态 的 测试 。 这 些 状态 内 的 测试 可 以 用 来 验证 进入 屏幕 的 真正 的 实际 功能 。 这 样 , 任 
意 复杂 的 对 话 框 链接 都 可 以 通过 这 种 模型 进行 导航 。GUI 的 状态 图 可 以 保证 在 测试 过 程 
中 能 检查 到 所 有 的 对 话 框 , 更 应 该 考虑 并 检查 通过 不 同 触发 事件 引起 的 各 个 转换 。 


1. 测试 用 例 


为 了 完整 定义 基于 状态 的 测试 用 例 ,需要 考虑 下 面 的 一 些 信息 : 
(1) 测试 对 象 的 初始 状态 (组 件 或 系统 ) ,初始 状态 是 必需 项 。 
(2) 测试 对 象 的 输入 。 
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图 4-5 DreamCar 状态 图 


(3) 期 望 结果 或 者 期 望 行为 。 

另外 ,在 测试 用 例 中 针对 每 个 期 望 的 状态 转换 需要 定义 以 下 一 些 内 容 : 

(1) 状态 转换 之 前 的 状态 。 

(2) 引起 状态 转换 的 触发 事件 。 

(3) 状态 转换 时 的 期 望 反 应 或 输出 。 

(4) 转换 后 的 期 望 状态 。 

确定 测试 对 象 的 状态 并 不 是 一 件 容 易 的 事 。 通 常 ,测试 对 象 的 状态 并 不 是 由 单一 变 
量 来 定义 的 ,有 时 候 是 由 一 群 变量 的 数值 来 定义 的 ,而 这 些 变量 可 能 隐藏 在 测试 对 象 中 。 
因此 ,对 每 个 测试 用 例 的 验证 和 评估 都 需要 付出 相当 大 的 代价 。 

(1) 从 测试 的 角度 评估 测试 对 象 的 状态 转换 图 。 假 如 测试 对 象 有 很 多 的 状态 和 状态 
转换 ,表明 需要 的 测试 工作 量 很 大 。 此 时 ,需要 选择 合适 的 策略 ,通过 将 测试 对 象 分 解 和 
分 层 , 以 简化 测试 对 象 。 

(2) 检查 说 明 ,确保 测试 对 象 的 状态 容易 标识 , 且 这 些 状 态 不 是 由 大 量 不同 变 量 或 变 
量 组 合 所 触发 的 。 
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(3) 检查 说 明 , 保 证 从 外 部 可 以 比较 容易 地 访问 状态 变量 。 在 测试 过 程 中 如 能 使 用 
设置 状态 / 重 置 状态 函数 以 及 读 取 状 态 值 函数 等 将 会 给 测试 带 来 很 大 益处 。 


2. 状态 转换 测试 技术 的 覆盖 率 计算 


对 状态 转换 测试 同样 可 以 定义 不 同 的 测试 强度 和 覆盖 率 ,例如 : 

(1) 每 个 状态 至 少 遍历 一 次 。 

(2) 每 个 状态 转换 至 少 遍历 一 次 。 

(3) 所 有 不 符合 说 明 的 状态 转换 都 已 经 检查 。 

与 前 面 描述 的 覆盖 率 的 计算 类 似 , 状 态 转换 测试 技术 的 覆盖 率 的 百分比 可 以 通过 实 
际 的 数目 与 总 数目 的 比值 来 表示 。 

对 于 测试 强度 要 求 高 的 应 用 程序 ,还 需要 补充 一 些 状 态 转换 测试 用 例 ,例如 ， 

(1) 所 有 状态 转换 的 组 合 。 

(2) 所 有 状态 的 任意 顺序 的 所 有 转换 。 


3. 状态 转换 测试 技术 的 优点 


状态 转换 测试 技术 适用 于 那些 状态 起 着 重要 作用 ,并 且 功能 也 会 因为 状态 的 不 同 而 
受到 影响 的 测试 对 象 。 前 面 介绍 的 其 他 类 型 的 测试 技术 并 不 具备 这 个 特点 ,它们 不 能 区 
盖 函 数 在 不 同 状态 下 有 不 同 的 行为 的 情况 。 

在 面向 对 象 的 系统 中 ,对 象 可 以 有 不 同 的 状态 ,选择 针对 对 象 进行 操作 的 方法 必须 
能 根据 不 同 的 状态 做 出 相应 的 反应 。 状 态 转换 测试 技术 对 于 面向 对 象 的 测试 非常 重要 ， 
因为 它 考虑 到 了 面向 对 象 的 特征 。 


4.3.5 用 例 测试 


1. 用 例 测 试 介绍 


用 例 测试 指 的 是 可 以 通过 用 例 或 业务 场景 设计 测试 用 例 的 测试 技术 。 用 例 描述 了 
参与 者 (Actor) 之 间 .参与 者 与 系统 之 间 的 交互 ,例如 被 测 对 象 针对 用 户 输入 产生 特定 的 
输出 。 每 个 用 例 都 需要 设置 前 置 条 件 , 这 是 用 例 成 功 执行 的 必要 条 件 。 每 个 用 例 结束 后 
都 需要 确定 后 置 条 件 , 这 是 在 用 例 执行 完成 后 能 观察 到 的 结果 和 系统 的 最 后 状态 。 用 例 
通常 由 一 个 主场 景 (基本 流 ) 和 几 个 可 供 选择 的 分 支 ( 备 选 流 ) 组 成 。 

用 例 描述 了 系统 最 可 能 使 用 的 过 程 流 ,因此 从 用 例 中 得 到 的 测试 用 例 ,是 发 现 系统 
实际 使 用 环境 中 存在 缺陷 的 最 有 效 的 方式 。 用 例 ,通常 也 称 为 场景 ,非常 有 助 于 设计 用 
户 或 客户 参与 的 验收 测试 ; 也 可 以 帮助 发 现 由 于 不 同 组 件 之 间 的 相互 作用 和 相互 影响 而 
产生 的 集成 缺陷 ,这 在 单个 的 组 件 测试 中 是 很 难 发 现 的 。 

用 例 或 者 业务 场景 的 描述 ,可 以 用 来 定义 相对 抽象 的 系统 需求 ,以 及 描述 典型 的 用 
户 和 系统 之 间 的 交互 。 图 4-6 显示 了 通过 ATM 机 取 钱 的 部 分 用 例 图 。 
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付款 单位 


条 件 
输 错 


密码 三 次 


银行 


图 4-6 ATM 机 用 例 图 


这 个 例子 中 与 用 户 相关 的 用 例 是 “ 取 钱 ”、“PIN 输入 请 求 " 和 “ 吞 卡 ”, 系 统 内 的 用 例 
用 椭圆 来 表示 。 用 例 之 间 的 关系 可 以 是 包含 ,也 可 以 是 扩展 。 在 图 4-6 中 ,用 例 “ 取 钱 "与 
用 例 “PIN 输入 请 求 "是 包含 关系 ,用 例 “ 取 钱 " 包 含 用例 PIN 输入 请 求 ”, 它 们 必须 共同 
组 合 才能 完成 一 个 完整 功能 。 而 用 例 “PIN 输入 请 求 ”与 用 例 “ 知 卡 ” 是 扩展 关系 ,用 例 
“ 香 卡 ”是 用 例 “PIN 输入 请 求 " 的 扩展 ,而 扩展 的 用 例 是 可 选 的 。 

用 例 图 主要 是 从 外 部 的 角度 描述 系统 ,一 般 从 用 户 的 角度 来 解释 系统 的 外 部 特征 或 
者 和 相 邻 系统 的 关系 。 这 种 外 部 的 联系 在 图 中 显示 为 和 * 参 与 者 (例如 在 图 中 的 人 的 模 
型 ) 相 连 的 边 。 

每 个 用 例 必须 满足 一 定 的 前 置 条 件 才 能 执行 。 在 ATM 机 上 取 钱 的 前 置 条 件 是 银行 
卡 必须 是 有 效 的 。 执 行 完 用 例 以 后 ,需要 有 后 置 条 件 。 例 如 ,正确 输入 PIN 之 后 ,就 可 以 
取 钱 了 。 然 而 ,首先 需要 输入 取 钱 的 数额 ,并 且 确 认 ATM 机 内 以 及 银行 卡 里 都 有 钱 。 前 
置 条 件 和 后 置 条 件 也 适用 于 用 例 图 中 的 控制 流 , 即 通过 用 例 图 的 路 径 。 

用 例 测 试 需要 从 外 部 的 角度 将 被 测 对 象 模型 化 ,用 例 图 和 用 例 是 进行 测试 用 例 设 计 
的 基础 。 用 例 测 试 技术 通常 用 来 测试 被 测 对 象 典型 的 使 用 场景 ,因此 在 系统 测试 和 验收 
测试 中 都 经 常 使 用 。 假 如 用 例 图 表示 被 测 对 象 不 同 子 系统 之 间 的 相互 作用 ,这 种 技术 也 
可 以 用 来 设计 集成 测试 的 测试 用 例 。 


2. 测试 用 例 


每 个 用 例 都 有 各 自 的 目的 以 及 期 望 结果 。 测 试 执行 以 后 ,需要 有 后 置 条 件 。 以 下 是 
确定 测试 用 例 的 必要 信息 : 

(1) 前 置 条 件 。 

(2) 其 他 可 能 的 条 件 。 

(3) 期 望 结 果 。 

(4) 后 置 条 件 。 
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然而 ,测试 用 例 的 具体 输入 数据 和 结果 并 不 能 直接 从 用 例 中 得 到 ,需要 对 每 个 输入 
和 输出 数据 的 具体 条 件 进 行 详细 的 分 析 , 用 例 图 中 的 每 个 选择 都 需要 有 测试 用 例 覆 盖 。 


3. 用 例 测 试 技术 覆盖 率 计 算 


可 能 的 准则 是 测试 用 例 图 中 的 每 个 可 能 的 用 例 和 每 种 可 能 的 执行 顺序 至 少 由 测试 
用 例 遍 历 一 遍 。 


4. 用 例 测试 技术 的 优 缺 点 分 析 


基于 用 例 的 测试 在 测试 典型 的 用 户 系 统 相互 作用 方面 非常 有 用 。 因 此 ,这 个 技术 常 
用 在 验收 测试 和 系统 测试 中 。 异 常 和 特殊 处 理 的 情况 也 可 以 在 用 例 图 中 表示 出 来 ,并 且 
可 以 包含 到 测试 用 例 中 (如 图 4-6 所 示 )。 由 于 没有 系统 的 办 法 来 确定 更 多 的 测试 用 例 以 
测试 在 用 例 图 中 没有 显示 的 情况 ,这 种 情况 下 可 以 考虑 其 他 的 一 些 测试 技术 ,例如 边界 
值 分 析 。 


.4 自 盒 测试 技术 


白 盒 测试 技术 (又 称 为 基于 结构 的 测试 ) 是 根据 被 测 对象 的 结构 系统 化 设计 测试 用 
例 的 一 种 方法 。 它 所 关注 的 结构 可 以 是 代码 的 结构 (控制 流 图 )、 数 据 的 结构 、 菜 单 的 结 
构 .模块 间 相 互 调用 的 结构 .业务 流程 的 结构 等 。 白 盒 测试 可 以 应 用 于 任何 测试 级 别 ,在 
不 同 测试 级 别 ,其 分 析 的 结构 可 能 有 所 不 同 ,例如 

(1) 应 用 在 组 件 测试 中 , 则 分 析 软 件 组 件 的 代码 结构 ,结构 体现 在 代码 的 控制 流 
图 内 。 

(2) 应 用 在 集成 测试 中 ,结构 可 能 是 组 件 间 调 用 的 结构 (调用 树 或 模块 调用 关系 图 ) 。 

(3) 应 用 在 系统 测试 或 验收 测试 中 ,结构 可 能 是 菜单 结构 .业务 过 程 或 Web 页 面 
结构 。 

满足 白 盒 测试 的 测试 缆 盖 率 ,意味 着 被 测 对 象 已 不 需要 基于 此 技术 再 进行 额外 的 测 
试 ,但 是 可 以 继续 应 用 其 他 测试 技术 。 白 盒 测 试 通常 需要 测试 工具 的 支持 ,例如 一 些 代 
码 覆 盖 工 具 可 以 用 来 获取 基于 结构 的 测试 覆盖 率 。 测 试 人 员 了 解 白 盒 测 试 技术 的 基本 
原理 ,有 助 于 更 好 地 开展 白 盒 测 试 。 本 节 主 要 根据 代码 的 结构 来 讲解 白 盒 测 试 的 原理 ， 
包括 : 

(1) 语句 覆盖 。 

(2) 判定 覆盖 。 

(3) 其 他 白 盒 测试 技术 。 
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4.4.1 语句 覆盖 和 覆盖 率 


1. 语句 覆盖 


100% 的 语句 覆盖 指 的 是 设计 若干 测试 用 例 来 测试 程序 ,使 得 程序 中 的 每 个 可 执行 
的 语句 至 少 被 执行 一 次 。 语 句 覆 盖 率 指 的 是 程序 内 被 执行 的 语句 数 与 程序 内 所 有 的 可 
执行 语句 数 的 比值 。 语 名 覆盖 分 析 的 关注 点 集中 在 被 测 对 象 的 可 执行 语句 上 ,测试 用 例 
的 执行 可 以 满足 事先 定义 的 语句 覆盖 率 要 求 。 

将 源 代 码 转 换 为 具有 一 定 结构 的 控制 流 图 是 开展 语句 覆盖 的 基础 。 控 制 流 图 中 的 
节点 表示 为 可 执行 的 语句 ,有 向 边 表示 节点 之 间 的 控制 流 。 假 如 在 程序 段 中 出 现 连 续 的 
一 般 语 句 ( 没 有 分 支 ) ,可 以 将 它们 视 为 一 个 节点 而 不 影响 其 结构 ,因为 执行 第 一 个 语句 
就 可 以 保证 执行 到 后 面 连续 的 所 有 语句 。 判 定语 句 (IF,CASE) 和 循环 语句 (WHILE， 
FOR) 会 有 一 个 以 上 的 出 口 , 即 有 多 条 边 。 

如 图 4-7 所 示 是 一 个 简单 的 程序 片段 所 对 应 的 控制 流 图 ,通过 这 个 例子 介绍 语句 覆 
盖 的 具体 步 又。 本 程序 只 包含 了 两 个 判定 和 一 个 循环 。 


Stmt 


IF 


说 明 : 


4-7 程序 控制 流 图 


2. 测试 用 例 


在 如 图 4-7 所 示 的 例子 中 ,假如 要 求 达到 100%% 的 语句 蓝 盖 率 ( 覆 盖 所 有 的 节点 ) ,只 
要 设计 一 个 测试 用 例 即 可 以 满足 要 求 。 该 测试 用 例 遍 历 的 顺序 如 下 : 

asb,f,g,h,d.e 

除了 上 述 的 测试 用 例 可 以 达到 100% 的 语句 覆盖 率 之 外 ,也 可 以 组 合 控制 流 图 中 的 
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另外 的 边 ,以 达到 要 求 的 语句 覆盖 准则 。 由 于 时 间 和 成 本 的 限制 ,测试 人 员 应 该 以 尽量 
少 的 测试 用 例 达到 测试 覆盖 要 求 ,以 提高 测试 的 效率 和 有 效 人 性 。 

每 个 测试 用 例 的 期 望 结果 应 该 从 说 明 中 获得 ,而 不 是 通过 源 代码 获得 。 执 行 测试 用 
例 之 后 ,将 测试 对 象 的 期 望 结 果 和 实际 结果 进行 比较 ,从 而 判断 两 者 之 间 存 在 的 差异 或 
者 发 现存 在 的 失效 。 


3. 覆盖 率 定义 


语句 覆盖 率 的 定义 如 下 : 
语句 覆盖 率 一 (被 覆盖 语句 的 数目 /所 有 语句 的 数目 ) X100% 
尽管 语句 覆盖 率 是 一 个 比较 弱 的 评判 标准 ,但 是 有 时 实现 100 多 的 语句 覆盖 率 也 是 
不 容易 的 。 例 如 程序 中 用 以 触发 异常 的 某 些 条 件 , 需 要 通过 庞大 的 开销 才 可 能 满足 ,或 
者 在 测试 执行 过 程 中 根本 不 会 满足 这 些 条 件 ,都 会 导致 难以 达到 100 凶 的 语句 覆盖 率 。 


4. 语句 覆盖 的 特点 


语句 覆盖 能 够 发 现 一 般 的 语句 ( 非 判 定 和 循环 语句 ) 错 误 。 假 如 要 求 达到 100% 的 语 
句 获 盖 率 ,但 是 有 些 语句 通过 任何 测试 用 例 都 无 法 获 盖 ,此 时 就 可 能 会 发 现 不 可 达 代 码 
( 即 死 代码 )。 

语句 获 盖 无 法 发 现 逻 辑 错 误 ,例如 在 IF 判定 语句 中 、 满 足 判 定 后 的 THEN 中 有 语 
句 \ 不 满足 判定 时 的 ELSE 中 没有 任何 语句 时 , 则 这 个 控制 流 图 中 有 一 条 THEN- 边 ,从 
这 个 判定 开始 ,至 少 有 一 个 节点 在 这 条 边 上 ,除了 这 条 THEN- 边 之 外 还 有 一 条 没有 任何 
节点 的 ELSE- 边 。 这 两 条 边 的 控制 流 在 判定 终点 ENDIF 上 汇合 。 在 语句 覆盖 中 ,一 条 
不 包含 任何 节点 的 空 的 ELSE- 边 (在 IF 和 ENDIF 之 间 ) 是 不 会 被 关注 的 ,在 这 种 情况 
下 ,语句 覆盖 只 考虑 了 满足 IF 判定 的 情况 ,而 不 考虑 不 满足 IF 判定 的 情况 ,因为 ELSE 
一 边 上 没有 任何 节点 。 如 果 在 程序 中 不 满足 IF 判定 时 出 现 错误 ,用 语句 覆盖 就 无 法 
发 现 。 


4.4.2 ”判定 覆盖 和 覆盖 率 


1. 判定 覆盖 


100% 的 判定 获 盖 指 的 是 设计 若干 测试 用 例 来 测试 程序 ,使 得 程序 中 的 每 个 判定 语 
句 中 的 每 个 分 支 至 少 被 执行 一 次 ,所 以 判定 获 盖 也 称 为 分 支 获 盖 。 判 定 获 盖 率 指 的 是 程 
序 内 遍历 到 的 分 支 数 与 程序 内 所 有 的 分 支 数 的 比值 ,或 遍历 到 的 边 数 与 程序 内 所 有 边 数 
的 比值 。 判 定 柳 盖 关 注 的 是 控制 流 图 中 的 边 , 即 不 仅 要 考虑 连接 一 般 语 句 的 边 , 更 要 考 
虑 判定 语句 的 所 有 分 支 。 测 试 需要 确保 每 个 判定 可 能 的 输出 (如 IF 语句 的 TRUE 和 
FALSE,CASE 语句 的 所 有 分 支 ) 都 得 到 了 执行 , 即 保证 每 个 判定 取 真 (TRUE) 至 少 一 次 
和 取 假 (FALSE) 至 少 一 次 。 
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判定 覆盖 比 语句 覆盖 具备 更 强 的 测试 强度 ,达到 100% 的 判定 覆盖 率 可 以 保证 达到 
100%% 的 语句 覆盖 率 , 但 达到 100 多 的 语句 覆盖 率 却 不 能 保证 达到 100 多 的 判定 覆盖 率 。 


2. 测试 用 例 


在 如 图 4-7 所 示 的 例子 中 , 若 测试 中 需要 覆盖 控制 流 图 中 的 所 有 分 支 (100%% 判 定 覆 
盖 ) , 则 需要 设计 比 语句 覆盖 更 多 的 一 些 额外 的 测试 用 例 。 要 达到 100% 的 语句 覆盖 率 ， 
只 要 执行 如 下 序列 的 测试 用 例 就 可 以 满足 : 

(1) a,b,f,g,h,d,e 

在 测试 用 例 中 边 c,i 和 卡 没有 被 执行 到 。 边 c 和 卡 是 条 件 的 空 判定 (ELSE), 而 i 是 
返回 到 循环 开始 的 边 。 因 此 ,需要 增加 额外 的 三 个 测试 用 例 : 

(2) a,b,c,d,e 

X39 bt de 

(4) a,k,e 

综合 这 4 个 测试 用 例 就 可 以 实现 完整 覆盖 控制 流 图 中 所 有 的 边 , 即 覆盖 测试 对 象 源 
代码 的 所 有 可 能 的 控制 流 判 定 。 通 过 进一步 的 分 析 , 发 现 测试 用 例 (1) 所 遍历 的 路 径 a， 
b,f,g,h,d,e 是 元 余 的 ,因为 测试 用 例 (3) 所 遍历 的 路 径 a,b,f,g,i,g,h,d,e 已 经 包含 了 
测试 用 例 (1) 遍 历 的 路 径 , 所 以 最 少 只 需要 三 个 测试 用 例 (2),(3) 和 (4) 就 能 达到 100% 的 
判定 覆盖 率 。 

在 测试 过 程 中 ,一 些 边 被 覆盖 的 次 数 可 能 不 止 一 次 ,尽管 有 些 元 余 , 但 这 常常 是 无 法 
避免 的 ,例如 边 a 和 e。 

对 每 个 测试 用 例 而 言 ,除了 前 置 条 件 和 后 置 条 件 , 同 时 需要 确定 期 望 结果 ,用 来 和 实 
际 结果 进行 对 比 。 而 且 , 比 较 合 理 的 做 法 是 记录 下 哪个 测试 用 例 执行 到 了 哪个 判定 ,这 
样 有 助 于 发 现 缺陷 ,特别 是 针对 那些 空 判定 , 即 那些 不 包含 任何 语句 的 判定 。 


3. 覆盖 率 定义 


类 似 于 语句 覆盖 ,判定 覆盖 的 覆盖 率 可 以 进行 如 下 定义 : 
判定 覆盖 率 = (被 覆盖 判定 的 数目 /总 边 的 数目 ) X100% 
覆盖 率 的 计算 仅仅 考虑 某 个 判定 的 分 支 是 否 被 执行 了 ,而 不 考虑 执行 的 频率 。 在 这 
个 例子 中 , 边 a 和 e 都 被 执行 了 4 次 ,在 每 个 测试 用 例 中 都 被 执行 了 一 次 。 
假如 只 执行 了 例子 中 前 面 的 两 个 测试 用 例 (2) 和 (3), 则 边 k 没有 被 执行 到 ,这 样 就 
执行 了 控制 流 图 内 10 条 边 中 的 9 条 边 ,判定 覆盖 率 是 : 
9/10X100% = 90% 
通过 比较 可 以 发 现 ,执行 测试 用 例 (3) 就 可 以 保证 100% 的 语句 柳 盖 率 , 但 是 100% 
的 语句 覆盖 率 却 无 法 保证 100% 的 判定 覆盖 率 。 因 此 ,测试 人 员 可 以 根据 测试 对 象 的 重 
要 程度 和 风险 级 别 定 义 不 同 的 测试 出 口 准 则 。 例 如 ,针对 最 重要 的 组 件 ,要 求 达 到 100% 
的 判定 覆盖 率 ; 而 对 于 其 他 组 件 , 只 要 达到 85% 的 判定 获 盖 率 即 可 。 通 常情 况 下 , 较 高 
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的 覆盖 率 需 要 更 高 的 测试 成 本 。 
4. 判定 覆盖 的 特点 


满足 100%% 判 定 覆 盖 率 通常 需要 执行 比 满足 100% 语 句 获 盖 率 更 多 的 测试 用 例 , 具 
体 执行 多 少 测试 用 例 主 要 由 测试 对 象 的 结构 来 决定 。 与 语句 覆盖 不 同 ,判定 覆盖 可 以 发 
现在 空 判定 (没有 任何 节点 的 边 ) 中 的 错误 。 

但 是 ,判定 覆盖 只 考虑 每 个 判定 的 所 有 取 值 ,而 没有 考虑 组 成 判定 的 原子 条 件 的 所 
有 取 值 ,因此 判定 覆盖 无 法 发 现 组 成 判定 的 原子 条 件 的 错误 。 


4.4.3 其 他 白 盒 测 试 技术 


除了 前 面 提 到 的 语句 覆盖 和 判定 覆盖 之 外 ,还 有 一 些 其 他 的 白 盒 测试 技术 ,例如 条 
件 柳 盖 判定- 条件 覆盖 条件 组 合 蓝 盖 .路 径 覆 盖 等 。 由 于 这 些 测试 技术 不 在 ISTQB 初 
级 考试 的 范围 ,这 里 不 再 详细 介绍 。 有 兴趣 的 可 以 参考 ISTQB 高 级 测试 分 析 师 考试 
内 容 。 


45 基于 经 验 的 测试 技术 


基于 经 验 的 测试 技术 指 的 是 根据 测试 人 员 的 经 验 、 知 识 和 直觉 来 进行 用 例 设计 和 / 
或 选择 的 一 种 技术 。 该 技术 依赖 于 测试 人 员 人 敏感 的 直觉 和 丰富 的 经 验 , 应 该 作为 系统 化 
测试 技术 (例如 黑 盒 测试 技术 和 白 盒 测试 技术 ) 的 有 效 补 充 。 通 过 基于 经 验 的 测试 可 以 
发 现 运 用 系统 化 测试 技术 进行 测试 时 无 法 或 者 很 难 发 现 的 缺陷 。 

基于 经 验 的 测试 技术 依赖 于 测试 人 员 的 经 验 ,因此 不 同 测试 人 员 测 试 得 到 的 效果 会 
有 极 大 的 不 同 。 常 见 的 基于 经 验 的 测试 技术 主要 包括 错误 推测 技术 (Error Guessing) 和 
探索 性 测试 技术 (Exploratory Testing) 。 

错误 推测 技术 在 实际 测试 工作 中 被 广泛 应 用 。 错 误 推测 技术 指 的 是 根据 测试 人 员 
以 往 的 经 验 ,猜测 在 组 件 或 系统 中 可 能 出 现 的 缺陷 或 错误 ,并 以 此 为 依据 来 进行 特殊 的 
用 例 设计 以 暴露 这 些 缺 陷 的 一 种 测试 设计 技术 。 一 般 情 况 下 ,测试 人 员 是 靠 经 验 来 预测 
缺陷 的 。 错 误 推测 技术 的 一 个 结构 化 方法 是 列举 可 能 的 错误 并 构造 可 能 的 错误 列表 ,并 
设计 测试 来 攻击 这 些 错误 ,这 种 系统 的 方法 称 为 缺陷 攻击 。 可 以 根据 经 验 `. 已 有 的 缺陷 
和 失败 数据 以 及 有 关 软 件 失败 的 常识 等 方面 的 知识 来 设计 这 些 缺 陷 和 失效 的 列表 。 

另 一 个 常见 的 基于 经 验 的 测试 技术 是 探索 性 测试 了 ?。 探 索性 测试 指 的 是 测试 人 员 根 
据 经 验 ,充分 发 挥 自己 的 主观 能 动 性 去 有 目的 地 设计 一 些 测试 用 例 ,通过 执行 这 些 测 试 


@ James Bach, Session-Based Test Management, Software Testing and Quality Engineering magazine, Nov. 
2000. 
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用 例 获得 有 用 的 相关 测试 结果 信息 ,并 通过 对 测试 结果 信息 的 分 析 来 设计 新 的 后 续 测 
试 , 它 是 一 种 非 正式 的 测试 设计 技术 。 探 索性 测试 更 强调 测试 人 员 的 个 人 自由 、 主 观 能 
动 性 和 职责 。 在 探索 性 测试 过 程 中 ,将 学 习 、 设 计 、 执 行 和 结果 分 析 作 为 并 行 且 相互 支持 
的 测试 活动 ,不 断 优化 测试 人 员工 作 的 价值 。 

探索 性 测试 根据 制定 的 测试 章程 ( 即 对 测试 目标 的 陈述 ,还 可 能 包括 关于 如 何 进行 
测试 的 测试 思路 。) 同 时 进行 测试 设计 ,测试 执行 、 测 试 记录 和 学 习 , 并 且 是 在 规定 时 间 内 
进行 的 。 特 别 适合 在 说 明 较 少 或 不 完备 且 时 间 压 力 大 的 情况 下 使 用 ,或 者 作为 对 其 他 更 
为 正式 的 测试 的 增加 或 补充 。 它 可 以 作为 测试 过 程 中 的 检查 ,以 有 助 于 确保 能 发 现 最 为 
严重 的 缺陷 。 

探索 性 测试 的 管理 是 一 个 难点 ,可 以 采用 基于 会 话 的 测试 管理 (Session-Based Test 
Management) ,每 个 会 话 的 时 间 建 议 不 要 超过 两 个 小 时 。 在 每 个 会 话 中 都 要 关注 以 下 
问题 : 

(1) 为 什么 要 执行 测试 ? 测试 执行 的 目标 是 什么 ? 

(2) 测试 什么 内 容 ? 

(3) 使 用 什么 测试 方法 以 及 如 何 使 用 测试 方法 ? 

(4) 需要 发 现 什 么 ? 

探索 性 测试 的 基本 思想 如 下 : 

(1) 一 个 测试 用 例 执行 的 结果 会 影响 到 后 期 测试 用 例 的 设计 和 执行 。 

(2) 测试 期 间 , 由 于 对 测试 对 象 不 了 解 , 或 缺乏 测试 依据 ,测试 人 员 需 要 为 测试 对 象 
构建 一 个 虚拟 的 模型 ,模型 中 包含 了 假定 的 测试 对 象 工作 方式 以 及 期 望 的 结果 。 

(3) 根据 模型 执行 测试 。 关 注 点 是 发 现 模型 中 没有 的 .与 假定 的 工作 方式 和 期 望 结 
果 不 一 致 处 。 

需要 注意 的 是 ,基于 经 验 的 测试 技术 并 不 能 简单 归 类 到 黑 盒 测试 技术 或 者 白 盒 测试 
技术 , 它 可 以 作为 系统 化 测试 技术 的 补充 ,发 现 一 些 它们 难以 发 现 的 缺陷 。 基 于 经 验 的 
测试 技术 的 成 功 实施 ,更 多 地 依赖 于 测试 人 员 的 技能 .直觉 和 他 们 对 以 前 类 似 的 测试 对 
象 、 使 用 技术 方面 的 经 验 。 

基于 经 验 的 测试 技术 可 以 应 用 于 不 同 的 测试 级 别 , 也 可 以 针对 不 同 的 测试 对 象 。 但 
对 基于 经 验 的 测试 技术 的 覆盖 率 很 难 计数 ,对 测试 过 程 中 发 现 的 问题 也 较 难 重 现 。 


.6 选择 测试 技术 


前 面 介绍 了 黑 盒 测 试 技术 ` 白 盒 测试 技术 和 基于 经 验 的 测试 技术 。 测 试 人 员 在 测试 
实践 过 程 中 ,应 该 根据 测试 上 下 文 进行 合理 选择 。 选 择 测 试 技术 的 基本 原则 是 用 尽 可 能 
少 的 测试 工作 量 , 生 成 足够 多 的 测试 用 例 ,并 能 最 大 限度 地 达到 测试 目标 ,例如 发 现 尽 可 
能 多 的 缺陷 。 
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测试 技术 的 选择 会 受到 各 种 因素 的 影响 ,例如 系统 类 型 ,法律 法 规 标准 、 客 户 或 合同 
的 需求 .风险 的 大 小 、 风 险 的 类 型 测试 的 级 别 、 测 试 的 目标 ,文档 的 可 用 性 、 测 试 人 员 的 
技能 水 平 . 时 间 和 成 本 预算 、 开 发 生命 周期 .用例 模 型 和 以 前 发 现 各 类 缺陷 的 经 验 等 。 

(1) 测试 对 象 类 型 : 不 同 的 程序 ,它们 的 规模 和 复杂 度 也 截然 不 同 。 应 该 根据 测试 
对 象 选择 合适 的 测试 技术 。 例 如 ,程序 中 的 判定 是 由 多 个 原子 条 件 组 合 而 成 的 ,那么 判 
定 获 盖 测试 是 不 充分 的 ,应 该 选择 合适 的 测试 技术 来 检查 程序 中 的 条 件 , 例 如 条 件 组 合 
覆盖 。 具 体 选择 哪 种 技术 还 依赖 于 失效 情况 下 给 客户 /用 户 带 来 损失 的 程度 。 

(2) 文档 和 工具 的 可 用 性 : 如 果 有 详细 的 说 明 或 者 模型 信息 ,就 可 以 将 它们 直接 作 
为 测试 设计 的 输入 ,从 而 得 到 具体 的 测试 用 例 。 这 样 就 可 以 极 大 地 减少 测试 设计 的 工 
作 量 。 

(3) 符合 标准 的 要 求 : 行业 标准 和 法 律 法 规 会 要 求 使 用 特定 的 测试 技术 和 覆盖 准 
则 ,特别 是 属于 安全 关键 系统 或 者 综合 系统 的 软件 。 

(4) 测试 人 员 的 经 验 : 具有 不 同 经 验 的 测试 人 员 会 选择 不 同 的 测试 技术 。 例 如 , 测 
试 人 员 会 倾向 使 用 以 前 找到 过 严重 失效 的 技术 。 

(5) 客户 的 期 望 : 客户 可 能 会 要 求 采用 特殊 的 测试 技术 和 达到 一 定 的 测试 获 盖 率 。 
这 是 种 比较 好 的 做 法 ,因为 它 一 般 能 降低 测试 工作 量 , 且 保证 在 客户 验收 测试 时 ,残留 更 
少 的 缺陷 。 

(6) 风险 分 析 : 通过 风险 分 析 来 指导 测试 工作 , 即 选择 具体 测试 技术 和 确定 测试 执 
行 的 范围 和 强度 。 对 于 高 风险 的 区 域 应 该 进行 更 彻底 的 测试 。 

(7) 其 他 因素 : 例如 说 明和 其 他 文档 的 可 用 性 ,测试 人 员 的 知识 ,技能 和 个 性 ,时 间 
和 预算 的 限制 ,测试 级 别 和 以 前 的 经 验 , 如 哪些 缺陷 发 生得 比较 频繁 ,通过 什么 测试 技术 
发 现 了 这 些 缺 陷 等 ,这 些 都 会 很 大 程度 地 影响 测试 技术 的 选择 。 

有 些 测 试 技术 适合 于 特定 的 环境 和 测试 级 别 , 而 有 些 则 适用 于 所 有 的 测试 级 别 。 测 
试 设计 技术 的 选择 应 该 基于 一 个 全 盘 的 考虑 来 决定 。 下 面 的 经 验 可 以 有 效 地 帮助 选择 
合适 的 测试 技术 。 

(1) 正确 实现 系统 的 功能 是 最 重要 的 。 任 何 情况 下 都 必须 首先 保证 对 测试 对 象 的 功 
能 进行 充分 的 验证 。 不 管 采用 什么 技术 ,所 有 测试 用 例 的 开发 都 包括 确定 测试 对 象 的 期 
望 结果 和 行为 。 这 样 就 可 以 保证 每 个 测试 用 例 对 系统 的 功能 进行 了 验证 ,也 可 以 判断 系 
统 是 否 存在 问题 或 系统 的 功能 是 否 被 正确 实现 。 

(2) 对 每 个 测试 对 象 只 要 有 合适 的 输入 或 输出 时 ,可 以 考虑 应 用 等 价 类 划分 技术 ,至 
少 可 以 划分 成 有 效 等 价 类 和 无 效 等 价 类 。 应 用 边界 值 分 析 来 对 等 价 类 进行 补充 并 设计 
测试 用 例 。 在 执行 这 些 测 试用 例 的 时 候 , 使 用 相应 的 覆盖 率 测 量 工 具 来 确认 是 否 达到 了 
要 求 的 测试 覆盖 率 。 

(3) 若 不 同 的 状态 会 影响 测试 对 象 的 运行 顺序 ,就 需要 应 用 状态 转换 测试 。 只 有 状 
态 转换 测试 可 验证 不 同 状态 状态 转换 和 相应 的 行为 之 间 的 关系 。 

(4) 若 给 出 了 测试 中 必须 考虑 的 输入 数据 之 间 的 相互 依赖 关系 ,这 些 依赖 关系 就 可 
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以 通过 因果 图 或 者 决策 表 技 术 进行 测试 设计 ,相应 的 测试 用 例 可 以 从 决策 表 中 导出 。 

(5) 显示 在 用 例 图 (Use Case Diagrams) 中 整个 系统 的 使 用 场景 往往 作为 系统 测试 
或 验收 测试 的 测试 用 例 设计 基础 。 

(6) 在 组 件 测试 和 集成 测试 中 , 黑 盒 测试 技术 应 该 包含 获 盖 率 度 量 。 没 有 执行 到 的 
测试 对 象 部 分 ,需要 在 白 盒 测试 中 进行 特别 的 考虑 。 可 以 根据 测试 对 象 的 重要 程度 和 属 
性 ,选择 相应 合适 的 白 盒 测试 技术 。 

(7) 考虑 具有 循环 结构 的 覆盖 率 时 ,至 少 需要 循环 一 次 。 对 于 系统 的 重要 和 敏感 部 
分 ,必须 应 用 相应 的 测试 方法 (例如 临界 内 部 路 径 的 测试 和 结构 化 路 径 的 测试 ) 来 验证 
循环 。 

(8) 白 盒 测 试 技术 和 黑 盒 测试 技术 可 以 用 在 所 有 的 测试 级 别 。 测 试 人 员 需 要 根据 被 
测试 对 象 的 特点 进行 选择 。 

(9) 不 能 忽视 基于 经 验 的 测试 用 例 。 这 是 对 系统 化 测试 设计 的 有 效 补 充 , 它 能 通过 
测试 人 员 的 经 验 来 发 现 更 多 的 问题 。 

这 里 需要 强调 如 下 几 点 。 

(1) 没有 一 种 测试 技术 能 够 考虑 和 获 盖 到 测试 的 方方面面 ,因此 测试 过 程 中 经 常会 
采用 不 同 测试 技术 的 组 合 。 

(2) 测试 技术 的 选择 以 及 测试 执行 的 强度 在 很 大 程度 上 取决 于 失效 时 所 造成 的 危害 
程度 。 

(3) 由 于 白 盒 测试 技术 的 基础 是 测试 对 象 的 结构 ,所 以 在 选择 具体 白 盒 测试 技术 时 
重点 考虑 和 分 析 测 试 对 象 的 结构 。 


@.7 习题 


1.(K3) 某 个 程序 有 三 个 输入 参数 A.B 和 C, 输 入 参数 的 有 效 条 件 是 AB 和 C 三 
B, 如 果 应 用 等 价 类 划分 的 技术 ,只 考虑 单 缺陷 组 合 ( 无 效 等 价 类 只 能 与 有 效 等 价 类 组 
合 ),( ”) 组 最 适合 做 此 程序 的 健壮 性 测试 (用 无 效 的 数据 进行 的 测试 )。 

(1) A>B, C<B 

(2) A>B, C>B 

(3) A<B, C>B 

(4) A<B, C<B 

A. (2)(4) 

B. (1)(2)(4) 

C. (1)(2)(3)(4) 

D. (2)(3) 
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2. (K3) 根 据 状 态 转 换 图 (如 图 4-8 所 示 ) ,分 析 状 态 转 换 表 ( 如 表 4-14 所 示 ) 内 哪些 
行 是 错误 的 ? 〈 ) 


SI |sS2 


S4 S3 
DS 
图 4-8 状态 转换 图 
表 4-14 状态 转换 表 
AT TS CMI1 CM2 A DS 
1 Sl S2 
2 S2 Sl S3 
3 S3 Sl S2 S4 
4 S4 S2 S3 
A. 第 1 行 
B. 第 2 行 
C. 第 2 和 3 行 
. 第 3 和 4 行 
3,(K3) 针 对 下 面 的 程序 段 : 
If (x>0 and y>0) then 
z=2z/x 
end if 
if (x>1 or z>1) then 
z=z+1 

end if 
z=ytz 


满足 100% 语 句 柳 盖 率 和 满足 100% 判 定 覆 盖 率 的 最 有 效 的 测试 (x,y,z 为 以 上 程序 
段 的 输入 参数 ) 为 ( )。 

(1) x=2, y=1, z=6 

(2) x=1, y=0, z=1 

(3) x=0, y=6, z=6 

(4) x=0, y=12, z=6 

A 《Dy C12 

B. (1)(2); (2)(3)(4) 

C. (2); (1)(2) 

D. (1)(2)(3)(1) 

4. (Kl1) ”系统 化 的 测试 主要 会 受 哪些 因素 的 影响 ? ( ) 

(1) 组 织 的 架构 
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(2) 测试 及 开发 过 程 的 成 熟 度 
(3) 项 目 时 间 的 限制 

(4) 安全 或 规范 需求 

(5) 参与 的 人 员 


A 
. (2)(3)(4) 

. (1)(3)(4)(5) 
(1)(2)(3)(4)(5) 


(1)(2) 


(RK1) 下 面 关 于 测试 设计 技术 的 描述 错误 的 是 ( 由 


. 使 用 测试 设计 技术 的 目的 是 为 了 识别 测试 条 件 和 开发 测试 用 例 
. 黑 盒 测试 设计 技术 是 依据 分 析 测 试 基础 文档 来 选择 测试 条 件 、 测 试用 例 或 测试 


数据 的 技术 


.和 白 盒 测试 设计 技术 是 基于 分 析 被 测 组 件 或 系统 的 结构 的 测试 技术 
. 系统 测试 使 用 黑 盒 测 试 技术 ,不 会 使 用 白 盒 测试 技术 


(K1) 以 下 不 属于 基于 结构 的 技术 的 共同 特点 的 是 ( 和 


. 根据 软件 的 结构 信息 设计 测试 用 例 

. 可 以 通过 已 有 的 测试 用 例 测 量 软件 的 测试 用 例 覆 盖 率 

. 通过 系统 化 地 导出 设计 用 例 来 提高 覆盖 率 

. 使 用 正式 或 非 正式 的 模型 来 描述 需要 解决 的 问题 

.(K2) 测 试用 例 根 据 参 与 人 员 的 经 验 和 知识 来 编写 ; 测试 人 员 、 开 发 人 员 、 用 户 和 其 


他 的 利益 相关 者 对 软件 软件 使 用 和 环境 等 方面 所 掌握 的 知识 作为 信息 来 源 之 一 ; 对 可 能 
存在 的 缺陷 及 其 分 布 情况 的 了 解 作为 另 一 个 信息 来 源 。 上 述 测试 设计 技术 属于 ( )。 


A. 
. 黑 盒 测 试 
. 基于 结构 的 测试 


[@] 


HF>PHI0NWPF>”PONAm 


白 盒 测试 


基于 经 验 的 测试 

(K2) 下 面 关于 等 价 类 的 说 法 错误 的 是 ( 》s 

等 价 类 划分 可 以 分 为 两 种 基本 类 型 的 数据 : 有 效 数据 和 无 效 数据 

等 价 类 划分 也 可 以 基于 输出 、 内 部 值 . 时 间 相关 的 值 以 及 接口 参数 等 进行 


. 等 价 类 技术 属于 基于 说 明 的 测试 技术 


等 价 类 划分 只 应 用 于 系统 测试 
(K2) 下 面 关于 决策 表 测 试 的 描述 错误 的 是 ( 有 


. 当 被 测 对 象 的 行为 由 一 些 逻辑 条 件 决定 时 ,可 应 用 决策 表 测 试 技术 
. 决策 表 的 优点 是 可 以 生成 测试 条 件 的 各 种 组 合 , 而 这 些 组 合 可 能 是 利用 其 他 方 


法 无 法 被 测试 到 的 


. 决策 表 的 每 一 列 对 应 了 一 个 业务 规则 ,该 规则 定义 了 各 种 条 件 的 一 个 特定 组 合 
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D. 决策 表 描绘 了 状态 和 输入 之 间 的 关系 ,并 能 显示 可 能 的 无 效 状态 转换 
10. 〈K3) 根 据 如 图 4-9 所 示 的 源 代码 控制 流 图 ,为 了 达到 100% 的 语句 柳 盖 率 ,最 少 
需要 设计 多 少 测试 用 例 ?( )(& RE 为 逻辑 与 and, | | 为 逻辑 或 or) 


图 4-9 源 代 码 控制 流 图 


入 了 全 

B: 世相 

CG 是 

本: 本 全 

11. (K3) 根 据 如 图 4-10 所 示 的 源 代 码 控制 流 图 ,为 了 满足 100% 的 判定 覆盖 率 , 至 
少 需要 多 少 测试 用 例 ? ( )(&&. 为 逻辑 与 and, | | 为 逻辑 或 or) 


图 4-10 源 代码 控制 流 图 
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A. 1 个 
本 
党 
4 个 


12.(K3) 某 公司 用 来 计算 不 同 工 作 年 限 的 员工 年 终 奖 系统 的 需求 描述 如 下 : 员工 在 
公司 的 工作 年 限 不 超过 3 年 ,年 终 奖 为 月 工资 的 25%; 员工 在 公司 的 工作 年 限 超过 3 年 ， 
年 终 奖 为 月 工资 的 50%; 员工 在 公司 的 工作 年 限 超过 5 年 ,年 终 奖 为 月 工资 的 75%; 工 
作 年 限 超过 8 年 ,年 终 奖 为 月 工资 的 100%。 员 工 工作 年 限 必须 是 整数 ,并 且 工 作 年 限 最 


大 值 不 超过 100。 


根据 上 述说 明 ,为 "工作 年 限 ? 划 分 等 价 类 ,得 到 的 有 效 等 价 类 的 数量 为 (  )。 


A. 2 
B. 4 
C.6 
Ds 


13. (K3) 公 司 定义 的 员工 工资 范围 的 下 限 为 2000 元 /月 ,上 限 为 51999 元 /月 ,工资 
为 整数 ,那么 员工 工资 的 边界 值 为 ( 


A. 1999, 51 999 
B. 2000,51 999 
C. 1999,51 998 
D. 2000,51 998 


)。 


14. (K3) 某 原始 决策 表 如 表 4-15 所 示 。 
表 4-15 决策 表 


en 


规 则 


~ 


w 


A 


5 


2 
~ 
oo 
避 
~ 
3 
屡 
已 
i 
号 
ww 
nN 
re 
上 
a 
~ 
宁 


Cl: ab 和 < 构成 三 
角形 ? 


:a=b? 


理 装 浴 
8 


C2,a=0c? 


<i<ix<| ~ 


C2:b=¢c? 


zlxix| < 


<lzi<| < 


zizi<x| «< 


只 < < 
zixlz| < 
<lziz| < 
zlzlz| < 


Al: 非 三 角形 


只 | < < < 工 
<izixix|z 
<ixlzi<x| 工 
xizizix|z 
xixixlz| z 
<|lzlx|lz| z 
<ix|lziz| z 
<|zlziz| z 


A2: 不 规则 三 角形 


< 


: 等 腰 三 角形 


理 广 党 
加 


A4: 等 边 三 角形 Y 


A5: 不 符合 逻辑 


于 


于 


等 


表 中 的 规则 可 能 存在 一 定 的 元 余 , 如 对 其 进行 优化 ,得 到 的 最 优 决策 表 的 规则 


有 ( ) 条 。 
A 3 
B. 6 
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C. 7 
D. 8 
15. (K3) 根 据 图 4-11 所 示 的 状态 转换 图 ,为 了 覆盖 所 有 的 状态 转换 ,至 少 需要 设计 


多 少 测试 用 例 ? ( ) 


A 
B. 3 
C.5 
D.7 
top 
pop[height>1] push* 
push[height<Max—1] top 
wm 
push 
push [height=Max—1] 
empty filled full 
pop[height=1] pop 


delete 图 例 
和 开始 状态 


@ 结束 状态 


人 状态 


一 转换 


图 4-11 状态 转换 图 


16.〈(K1) 下 面 哪个 是 属于 基于 说 明 测 试 技术 的 特点 ? 〈 ) 

A. 根据 软件 的 结构 信息 获取 测试 用 例 

B. 可 以 通过 已 有 的 测试 用 例 测 量 软件 的 测试 缆 盖 率 , 并 通过 系统 化 导出 设计 测试 
用 例 来 提高 测试 覆盖 率 

C. 使 用 正式 或 者 非 正式 的 模型 来 描述 需要 解决 的 问题 或 者 软件 

D. 测试 用 例 根据 参与 人 员 的 经 验 和 知识 来 获得 

17. (K3) 针 对 下 面 的 程序 ,满足 100% 语 句 著 盖 的 测试 用 例 (a,b 的 值 ) 为 ( Ds 


If (a>0 And b>5) Then 
c=at+b 

End If 

If(a>5 or b>10) Then 
c=a-b 

End If 


A. a=10,b=4 
B. a=—2,b=12 
C. a=2,b=1 
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D. a=6,b=6 
18. (K3) 针 对 下 面 的 程序 代码 ,至 少 需要 多 少 个 测试 用 例 才 能 满足 100% 的 判定 柳 
盖 率 ? ( ) 


/* 输 入 1 到 10 之 间 的 偶数 * / 
# include < stdio.h> 

int main( ) 

{ 

int i=1; 

while(i<=10) 

{ 

If(i%2==0) // 能 整除 2 就 是 偶数 
{ 

Printf(" %d", i); 

} 


i++; 


测试 管理 | 


学 习 目 标 
编号 考点 

LO-5.1.1 ”识别 独立 测试 的 重要 性 

LO-5.1.2 ”阐明 在 组 织 内 进行 独立 测试 的 优点 和 缺点 

LO-5.1.3 ”识别 创建 测试 小 组 需要 考虑 不 同 角色 的 团队 成 员 

LO-5.1.4 ， 牢记 测试 组 长 和 测试 人 员 的 主要 任务 

LO-5.2.1 ， 识别 测试 计划 的 不 同 级 别 和 目标 

LO-5.2.2 ”根据 (软件 测试 文档 标准 》(IEEE Std 829 一 1998) ,总 结 测试 计 
划 测试 设计 说 明和 测试 规程 的 目的 及 内 容 

LO-5.2.3 ”从 概念 上 区 分 不 同 的 测试 方法 ,例如 分 析 法 、 基 于 模型 的 方法 、 系 
统 法 ,符合 过 程 /标准 的 ,动态 /启发 式 的 咨询 式 或 可 重用 的 方法 

LO-5.2.4 ”区 分 为 系统 所 做 的 测试 计划 和 测试 执行 进度 安排 的 不 同 之 处 

LO-5.2.5 ”为 一 组 给 定 的 测试 用 例 编写 测试 执行 进度 表 , 需 要 考虑 优先 级 、 
技术 和 人 逻辑 关系 等 内 容 

LO-5.2.6 ” 列 出 在 测试 计划 时 应 该 考虑 的 测试 准备 和 执行 活动 

LO-5.2.7 ”记忆 影响 测试 成 果 的 主要 因素 

LO-5.2.8 从 概念 上 区 分 两 种 不 同 的 估算 方法 : 基于 度量 的 方法 和 基于 专 
家 的 方法 

LO-5.2.9 理解 /证 明 应 该 针对 特定 的 测试 级 别 和 测试 用 例 组 定义 恰当 的 
入 口 准则 和 出 口 准 则 (例如 集成 测试 .验收 测试 或 可 用 性 测试 的 
测试 用 例 ) 

LO-5. 3.1 ”记忆 用 于 监督 测试 准备 和 执行 的 常见 度量 项 

LO-5. 3.2 ”根据 不 同 的 目的 和 用 途 对 于 测试 报告 和 测试 控制 中 用 到 的 测试 


度量 进行 说 明和 比较 (例如 已 发 现 和 已 修复 的 缺陷 、 通 过 和 失败 
的 测试 ) 


级 别 
Kl 
K2 
Kl 
Kl 
Kl 
K2 


K2 


K2 
K3 


Kl 


Kl 


K2 


K2 


Kl1 
K2 
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LO-5. 3.3 


LO-5. 
LO-5. 


LO-5. 
LO-5. 
LO-5， 
LO-5. 


LO-5. 


LO-5. 


i 


PP 


一 


根据 人 软件 测试 文档 标准 》(IEEE Std 829 一 1998) ,总 结 测试 总 
结 报告 的 目的 和 内 容 

总 结 配置 管理 如 何 支 持 测试 

将 可 能 威胁 一 个 或 多 个 利益 相关 者 实现 项 目 目标 的 潜在 问题 描 
述 为 风险 

牢记 风险 的 级 别 是 由 可 能 性 (发 生 的 可 能 性 ) 和 影响 程度 (发 生 
后 所 造成 的 危害 ) 来 决定 的 

区 分 项 目 风险 和 产品 风险 

识别 典型 的 产品 风险 和 项 目 风险 

通过 例子 来 描述 在 测试 计划 中 如 何 进 行 风险 分 析 和 风险 管理 
按照 (软件 测试 文档 标准 )(IEEE Std 829 一 1998) 总 结 事件 报告 
的 内 容 

针对 测试 过 程 中 发 现 的 失效 编写 事件 报告 


K2 


K2 
K2 


Kl1 
K2 
Kl1 
K2 


Kl1 


K3 
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术语 
术 语 含义 解 释 
Tester 测试 员 参与 测试 组 件 /系统 的 专业 技术 人 员 
负责 测试 和 评估 测试 对 象 的 人 。 他 (她 ) 指 导 、 控 制 、 
ee wii 管理 测试 计划 及 调整 对 测试 对 象 的 评估 
针对 特定 项 目的 测试 策略 的 实现 ,通常 包括 根据 测试 
项 目的 目标 和 风险 进行 评估 之 后 所 做 的 决策 、 测 试 过 
ee Wn 程 的 起 点 .采用 的 测试 设计 技术 、 退 出 准则 和 所 执行 
的 测试 类 型 
一 个 高 级 文档 ,该 文档 定义 了 需要 对 程序 (一 个 或 多 
Re 罗 汪 第 认 个 项 目 ) 执 行 的 测试 级 别 和 需要 进行 的 测试 
将 软件 组 件 或 系统 的 缺陷 数 和 软件 或 者 组 件 规模 相 
Defect Density 缺陷 密度 比 的 一 种 度量 (标准 的 度量 术语 包括 每 千 行 代码 、 每 
个 类 或 功能 点 存在 的 缺陷 数 ) 
指定 类 型 中 单位 度量 内 发 生 失 效 的 数目 。 例 如 ,单位 
Failure Rate 失效 率 时 间 失 效 数 、 单 位 处 理 失 效 数 、 单 位 计算 机 运行 失 
效 数 
当 监 测 到 的 结果 与 预期 情况 背离 时 ,制定 和 应 用 一 组 
Test Control 测试 控制 修正 动作 以 使 测试 项 目 保持 正常 进行 的 测试 管理 工 
作 ,参见 Test Management 
处 理 与 定时 检查 测试 项 目 状态 等 活动 相关 的 测试 管 
Test Monitoring 测试 监视 理工 作 , 准 备 测试 报告 来 比较 实际 结果 和 期 望 结 果 ， 
参见 Test Management 
ee ng mcat 测试 管理 ee 
总 结 测试 活动 和 结果 的 文档 ,也 包括 对 测试 项 是 否 符 
结 
Test Summary Report 测试 总 结 报 告 合 退 出 准则 进行 的 评估 
一 套 技术 和 管理 方面 的 监督 原则 ,用 于 确定 和 记录 一 
Configuration 配置 管理 个 配置 项 的 功能 和 物理 属性 ,控制 对 这 些 属性 的 变 
Management 更 .记录 和 报告 变更 处 理 和 实现 的 状态 ,以 及 验证 与 
指定 需求 的 一 致 性 
Version Control 版 本 控制 参见 Configuration Control 
配置 管理 的 一 个 方面 ,包括 在 正式 配置 完成 之 后 对 配 
Configuration Control 配置 控制 置 项 进行 评价 .协调 .批准 或 撤销 以 及 变更 修改 的 
控制 
Product Risk 产品 风险 与 测试 对 象 有 直接 关系 的 风险 ,参见 Risk 
_ 与 (测试 ) 项 目的 管理 与 控制 相关 的 风险 ,例如 缺乏 配 
es ie 备 人 员 、 严 格 的 限期 .需求 的 变更 等, 参见 risk 
Re 风险 将 会 导致 负面 结果 的 因素 ,通常 表达 成 可 能 的 (负面 ) 


影响 
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续 表 


术 语 会 文 解 释 


在 项 目 初 始 阶段 使 用 的 一 种 测试 方法 ,用 来 降低 产品 
风险 的 级 别 并 通知 利益 相关 者 产品 风险 的 状态 ,这 个 


Risk besed Testing | 基于 风险 的 测试 | 方法 包括 了 产品 风险 识别 和 使 用 风险 级 别 指导 测试 
过 程 
和 事件 日 志 记录 所 发 生 的 (例如 在 测试 过 程 中 ) 事 件 的 详细 情况 


识别 ,调查 、 采 取 行动 和 处 理事 件 的 过 程 ,该 过 程 包含 
对 事件 进行 记录 、 分 类 并 辨识 其 带 来 的 影响 


报告 任何 需要 调查 的 事件 (如 在 测试 过 程 中 需要 调查 
的 事件 ) 的 文档 


Incident Management 事件 管理 


Incident Report 事件 报告 


6.1 测试 组 织 


测试 活动 贯穿 于 整个 软件 开发 生命 周期 ,与 之 相关 的 测试 任务 必须 紧密 地 与 开发 活 
动 进 行规 划 和 协调 。 本 章 阐述 了 组 织 测试 团队 的 方式 、 测 试 团队 成 员 所 应 具备 的 角色 和 
职责 ,测试 经 理 的 任务 以 及 进行 高 效 测试 所 需要 的 辅助 过 程 。 


5.1.1 测试 组 织 和 测试 独立 性 


测试 独立 性 会 随 着 组 织 特点 和 产品 要 求 的 不 同 而 有 所 不 同 , 需 要 根据 实际 的 测试 上 
下 文选 择 合适 的 测试 独立 性 。 选 择 测试 独立 性 时 ,需要 考虑 和 平衡 相应 测试 独立 性 的 优 
点 和 缺点 。 


1. 独立 测试 方式 


测试 过 程 中 使 用 的 测试 方法 ,与 在 项 目 分 析 和 开发 中 使 用 的 方法 是 不 同 的 。 一 定 程 
度 的 独立 测试 ,可 以 避免 由 于 开发 人 员 对 自己 代码 偏爱 导致 的 问题 ,也 可 以 更 加 高 效 地 
发 现 软件 缺陷 。 独 立 测试 并 不 是 说 开发 人 员 不 能 进行 测试 ,开发 人 员 有 时 也 可 高 效 地 在 
他 们 的 代码 中 找 出 很 多 缺陷 。 因 此 ,需要 根据 具体 的 情况 ,选择 合适 的 独立 测试 类 型 。 
下 面 是 常见 的 一 些 独立 测试 类 型 。 

(1) 开发 人 员 负 责 测试 ,开发 人 员 测试 自己 的 代码 ( 自 测试 ) 。 

(2) 开发 团队 负责 测试 ,开发 人 员 相互 测试 对 方 的 代码 (同伴 测试 ) 。 

(3) 在 开发 团队 中 有 专业 的 测试 人 员 负 责 测试 开发 人 员 的 代码 。 

(4) 组 织 内 有 没有 开发 任务 的 专门 测试 团队 ,测试 团队 内 的 测试 人 员 测 试 开发 人 员 
的 代码 。 
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(5) 针对 特定 测试 类 型 的 独立 测试 专家 /顾问 ,例如 易 用 性 测试 人 员 、 安 全 性 测试 人 
员 或 认证 测试 人 员 ( 他 们 根据 标准 和 法 律 法 规 对 软件 产品 进行 认证 ) 。 

(6) 测试 机 构 或 测试 实验 室 (内 部 或 外 部 ) 。 

(7) 组 织 外 的 独立 测试 人 员 。 

开发 人 员 和 测试 人 员 在 测试 心理 方面 有 所 不 同 ,开发 人 员 难 以 客观 ,有效 地 测试 自 
己 开发 的 软件 。 由 于 开发 人 员 对 需求 和 设计 方面 的 误解 而 产生 的 缺陷 ,开发 人 员 将 更 加 
难以 发 现 。 

另外 ,软件 产品 的 开发 过 程 受到 时 间 ,成 本 和 质量 三 者 的 制约 ,时 间 和 成 本 指标 便于 
度量 ,而 质量 却 很 难度 量 。 假 如 开发 人 员 负 责 测试 活动 ,当时 间 、 成 本 和 质量 三 者 发 生 矛 
慎 时 ,开发 人 员 在 时 间 压 力 下 容易 忽视 质量 ,导致 难以 有 效 开展 测试 活动 。 如 果 测 试 组 
织 与 开发 组 织 来 自 不 同 的 机 构 , 来 自 开 发 组 织 的 管理 压力 可 以 相对 减少 ,减少 测试 过 程 
中 受到 的 干扰 。 

因此 ,在 尽量 避免 开发 人 员 测 试 自己 开发 的 软件 ,特别 是 在 相对 高 级 别 的 测试 中 ,如 
系统 测试 或 验收 测试 。 对 于 庞大 、 复 杂 或 安全 关键 的 项 目 ,通常 有 多 级 别 的 测试 ,并 让 独 
立 的 测试 人 员 负 责 某 些 级 别 或 所 有 的 测试 。 开 发 人 员 也 可 以 参与 测试 ,尤其 是 一 些 低 级 
别 的 测试 ,但 是 开发 人 员 往 往 缺 少 客观 性 ,会 限制 他 们 测试 的 有 效 性 。 独 立 测试 人 员 有 
权 要 求 和 定义 测试 过 程 及 规则 ,但 是 测试 人 员 应 该 只 有 在 存在 明确 管理 授权 的 情况 下 才 
能 充当 这 种 过 程 相关 的 角色 。 


2. 独立 测试 的 优点 


测试 过 程 中 采用 独立 测试 的 方式 ,无 论 在 技术 上 还 是 管理 上 ,对 提高 软件 测试 的 有 
效 性 都 具有 重要 意义 。 独 立 测试 的 优点 具体 表现 如 下 。 

1) 公正 和 客观 性 

抱 有 客观 的 态度 ,而 客观 的 态度 可 以 帮助 解决 测试 中 的 心理 问题 , 即 相 对 于 开发 人 
员 ,测试 人 员 更 能 够 以 发 现 软 件 中 的 缺陷 作为 测试 目的 而 开展 工作 ,可 以 发 现 一 些 其 他 
不 同 的 缺陷 。 同 时 ,独立 的 测试 人 员 可 以 验证 开发 人 员 在 系统 说 明和 实现 阶段 所 做 的 一 

2) 专业 性 

独立 测试 作为 职业 化 的 工作 ,在 长 期 的 测试 工作 中 能 够 积累 大 量 实践 经 验 ,形成 自 
己 的 职业 优势 。 同 时 ,软件 测试 与 开发 所 需 的 专业 知识 不 同 、 采 用 的 技术 不 同 、 思 维 的 方 
式 也 有 所 不 同 (创造 性 与 破坏 性 )。 因 此 ,测试 过 程 需要 测试 人 员 具 备 特定 的 技术 和 技 
能 ,并 对 测试 过 程 持 续 不 断 进行 改进 。 专 业 化 分 工 是 提高 测试 水 平 .保证 测试 质量 、 充 分 

3) 权威 性 

由 于 测试 团队 具备 专业 优势 ,独立 测试 工作 形成 的 测试 结果 更 具 信服 力 。 而 测试 结 
果 常 常 和 对 软件 的 质量 评价 联系 在 一 起 ,因此 ,由 专业 化 的 独立 测试 机 构 进行 评价 的 权 
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威 性 更 强 。 

4) 资源 有 保证 

独立 测试 机 构 的 主要 任务 是 进行 独立 测试 ,这 使 得 测试 工作 在 经 费 、 人 力 和 时 间 方 
面 更 有 保证 ,不 会 因为 开发 的 压力 而 减少 对 测试 的 投入 、 降 低 测试 的 有 效 性 ,可 以 避免 开 
发 组 织 侧重 软件 开发 而 对 测试 工作 产生 不 利 的 影响 。 


3. 独立 测试 的 缺点 


测试 的 独立 性 并 不 总 是 越 高 越 好 。 随 着 测试 独立 性 的 提高 也 会 带 来 一 些 问题 ， 
例如 : 

(1) 整个 组 织 的 复杂 度 越 来 越 高 ,管理 成 本 增加 , 当 测 试 团队 不 属于 该 组 织 的 时 候 ， 
无 法 及 时 监控 测试 团队 的 测试 质量 。 

(2) 沟通 效率 降低 ,原来 可 能 只 是 需要 口头 交流 的 问题 ,现在 需要 通过 复杂 的 配置 管 
理 、 缺 陷 管理 和 文档 管理 系统 来 解决 。 

(3) 测试 人 员 和 开发 人 员 的 距离 越 来 越 远 ,项 目 团队 氛围 可 能 会 下 降 , 某 些 极端 情况 
下 甚至 可 能 会 出 现 开发 人 员 和 测试 人 员 的 对 立 现象 。 

(4) 测试 人 员 重 点 关注 测试 相关 技能 ,对 开发 技能 掌握 得 比较 少 , 不 利于 发 现 系 统 需 
求 和 设计 方面 的 缺陷 。 

(5) 独立 的 测试 团队 可 能 降低 开发 人 员 对 软件 质量 的 责任 感 ,开发 人 员 可 能 会 觉得 
产品 质量 应 该 是 测试 团队 的 事情 ,而 不 是 整个 项 目 团队 的 责任 。 

(6) 独立 的 测试 团队 可 能 同时 为 多 个 项 目 进行 测试 ,独立 的 测试 人 员 可 能 被 视 为 瓶 
颈 或 成 为 延 时 发 布 而 被 责备 的 对 象 。 

一 个 组 织 的 测试 活动 可 以 采用 多 种 测试 独立 性 策略 ,不 同 的 测试 级 别 也 可 以 使 用 不 
同形 式 的 测试 独立 性 策略 。 通 常情 况 下 ,低级 别 的 测试 采用 独立 性 比较 低 的 策略 ,高 级 
别 的 测试 采用 独立 性 比较 高 的 策略 。 例 如 组 件 测试 和 集成 测试 由 开发 人 员 完 成 ,系统 测 
试 由 企业 内 部 独立 的 测试 团队 完成 ,验收 测试 可 以 由 引入 组 织 外 的 测试 团队 完成 ,如 
表 5-1 所 示 。 具 体 的 形式 可 以 根据 组 织 和 项 目的 实际 情况 进行 调整 。 


表 5-1 测试 团队 和 测试 级 别 


独立 性 
不 同 的 开发 人 员 组 织 内 独立 的 测试 团队 | 组 织 外 部 的 测试 团队 
级 别 
组 件 测试 XxX 
集成 测试 
系统 测试 XxX 
验收 测试 XxX 
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5.1.2 ”测试 组 长 (测试 经 理 ) 和 测试 人 员 的 任务 


测试 团队 的 构成 和 其 规模 没有 特别 的 关系 。 即 使 测试 团队 只 有 一 个 人 ,这 个 人 也 需 
要 扮演 不 同 的 角色 ,承担 不 同 的 测试 职责 。 


1. 测试 团队 的 角色 


在 本 课程 大 纲 中 ,主要 涉及 两 个 测试 角色 : 测试 组 长 和 测试 人 员 。 这 两 个 角色 执行 
的 活动 和 任务 是 由 项 目 和 产品 的 背景 人 员 的 角色 和 组 织 结构 来 决定 的 。 测 试 组 长 也 称 
为 测试 经 理 或 测试 协调 人 。 测 试 组 长 的 角色 也 可 以 由 项 目 经 理 、 开 发 经 理 、 质 量 保 证 经 
理 或 测试 组 的 经 理 来 担任 。 

(1) 测试 经 理 : 测试 计划 和 测试 控制 专家 ,具备 软件 测试 .质量 管理 、 项 目 管理 和 人 
员 管 理 等 领域 的 知识 和 经 验 。 

(2) 测试 人 员 : 又 可 以 细 分 成 如 下 角色 : 

Q@ 测试 设计 人 员 / 测 试 分 析 人 员 : 专 于 测试 方法 和 开发 测试 用 例 并 且 确 定 测试 用 例 
的 执行 顺序 ,具备 开发 和 测试 知识 、 软 件 工程 以 及 测试 用 例 设计 方法 等 领域 的 知识 和 
经 验 。 

@ 测试 自动 化 人 员 : 测试 自动 化 专家 ,具备 测试 基础 知识 、 编 程 经 验 ,以 及 丰富 的 自 
动 化 测试 工具 和 脚本 语言 知识 。 利 用 项 目 中 提供 的 测试 工具 , 按 需要 进行 自动 化 的 
测试 。 

@ 测试 系统 管理 人 员 ( 实 验 室 管理 人 员 ): 安装 和 操作 测试 环境 方面 的 专家 ,具备 
系统 管理 员 知 识 。 建 立 和 支持 测试 环境 ,需要 经 常 与 系统 管理 员 和 网 络 管理 员 进 行 
协调 。 

@ 测试 执行 人 员 : 执行 测试 和 编写 事件 报告 方面 的 专家 ,具备 IT 基础 知识 、 测 试 基 
础 知识 ,能 使 用 测试 工具 (缺陷 管理 工具 等 ) ,熟悉 被 测试 对 象 。 

测试 人 员 也 常常 作为 以 上 提 及 的 除 测试 经 理 外 的 所 有 角色 的 通用 名 称 。 


2. 测试 团队 职责 


优秀 的 测试 团队 必须 明确 定义 不 同 的 角色 和 职责 。 明 确 的 职责 是 实现 高 效 测试 团 
队 的 前 提 。 测 试 团队 中 主要 的 角色 职责 如 下 。 

1) 测试 经 理 

(1) 与 项 目 经 理 以 及 其 他 相关 人 员 共 同 协调 测试 策略 和 测试 计划 。 

(2) 将 测试 的 安排 合并 到 其 他 项 目 活动 中 ,例如 集成 计划 。 

(3) 制订 测试 计划 (要 考虑 背景 ,了 解 测试 目标 和 风险 ), 包 括 选择 测试 方法 ,估算 测 
试 的 时 间 、 工 作 量 和 成 本 ,获取 资源 ,定义 测试 级 别 、 测 试 周期 并 规划 事件 管理 等 。 
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(4) 启动 测试 说 明 、 测 试 准备 ,测试 实 施 和 测试 执行 ,监督 测试 结果 并 检查 出 口 
准则 。 
(5) 根据 测试 结果 和 测试 过 程 ( 有 时 记录 在 状态 报告 中 ) 调 整 测试 计划 ,并 采取 任何 
必要 措施 解决 存在 的 问题 。 


(6) 对 测试 件 进行 配置 管理 ,保证 测试 件 的 可 追溯 性 。 

(7) 引入 合适 的 度量 项 以 测量 测试 进度 ,评估 测试 和 产品 的 质量 。 

(8) 决定 什么 应 该 自动 化 、 自 动 化 的 程度 ,以 及 如 何 实现 。 

(9) 选择 测试 工具 支持 测试 ,并 为 测试 人 员 组 织 测试 工具 使 用 的 培训 。 

(10) 决定 关于 测试 环境 实施 的 问题 。 

(11) 根据 在 测试 过 程 中 收集 的 信息 编写 测试 总 结 报告 。 

2) 测试 人 员 

(1) 测试 设计 人 员 / 测 试 分 析 人 员 

@ 分 析 、 评 审 和 评估 用 户 需 求 .设计 和 模型 等 内 容 的 可 测试 性 ,以 便 设计 测试 用 例 。 

@ 创建 概要 测试 用 例 和 详细 测试 用 例 。 

@ 准备 和 获取 测试 数据 。 

(2) 测试 自动 化 人 员 

QO 负责 设计 和 搭建 模块 化 的 、 可 维护 的 自动 化 测试 环境 。 

@ 自动 化 测试 需求 分 析 和 使 用 适合 项 目 特 点 的 测试 工具 实现 测试 用 例 的 自动 化 
脚本 。 

(3) 测试 系统 管理 员 

QO@ 负责 或 协助 测试 环境 的 规划 和 搭建 ,维护 环境 的 正常 运行 。 

@ 安装 新 的 测试 平台 、 被 测试 的 系统 等 。 

@ 优化 测试 环境 ,提高 测试 环境 中 网 络 、 服 务 器 和 其 他 设备 运行 的 性 能 。 

(4) 测试 执行 人 员 

@ 评审 和 参与 测试 计划 的 制订 。 

@ 进行 各 种 级 别 的 测试 ,执行 并 记录 测试 日 志 , 评 估 测 试 结 果 , 记 录 实 际 结果 和 期 望 
结果 之 间 的 偏差 。 

@ 根据 需要 使 用 测试 管理 工具 和 测试 监控 工具 。 

@ 在 可 行 的 情况 下 ,测试 组 件 和 系统 的 性 能 。 

@ 对 他 人 的 测试 进行 评审 。 

从 事 测 试 分 析 ,测试 设计 、 特 定 测试 类 型 或 自动 化 测试 方面 的 工作 人 员 都 可 以 是 这 
些 角色 的 专家 。 根 据 项 目 或 产品 的 测试 级 别 及 可 能 存在 的 风险 ,建议 由 不 同 的 人 充当 各 
种 测试 的 角色 ,同时 保持 一 定 的 独立 性 。 在 组 件 测试 和 集成 测试 的 级 别 , 测 试 人 员 的 角 
色 可 能 是 开发 人 员 担 当 , 但 在 验收 测试 级 别 , 测 试 人 员 一 般 是 业务 方面 的 专家 和 用 户 , 进 
行 操作 性 验收 测试 的 一 般 是 用 户 方 的 系统 管理 员 。 
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G6.2 测试 计划 和 估算 


测试 计划 和 估算 是 整个 测试 过 程 中 的 重要 活动 。 本 节 将 描述 在 开发 和 实施 项 目 过 
程 以 及 维护 过 程 中 ,如 何 更 好 地 制订 测试 计划 。 本 节 主 要 包括 的 内 容 如 下 。 

(1) 什么 是 测试 计划 。 

(2) 测试 计划 包括 哪些 活动 。 

(3) 测试 执行 的 入 口 准 则 。 

(4) 测试 执行 的 出 口 准则 。 

(5) 测试 成 本 估算 。 

(6) 测试 策略 /测试 方法 。 


5.2.1 测试 计划 


测试 计划 可 以 作为 项 目 计 划 的 一 部 分 ,也 可 以 是 一 篇 单独 的 文档 。 一 个 项 目 可 以 只 
有 一 个 测试 计划 ,也 可 以 有 多 个 测试 计划 (例如 不 同 的 测试 级 别 有 单 独 的 测试 计划 )。 测 
试 计划 从 整体 上 描述 了 如 何 组 织 和 开展 测试 活动 , 它 描述 了 测试 的 目标 ,测试 的 范围 , 测 
试 的 方法 ,测试 所 需 的 资源 以 及 测试 活动 的 进度 ,同时 识别 测试 需要 获 盖 的 功能 \ 执 行 的 
测试 任务 ,测试 相关 的 人 员 以 及 可 能 的 风险 等 。 测 试 计划 的 制订 需要 符合 组 织 的 质量 方 
针 、 测 试 方针 和 测试 指南 。 

测试 计划 文档 的 格式 和 模板 可 以 参考 (软件 测试 文档 标准 》(IEEE Std 829 一 1998) 。 
下 面 对 IEEE Std 829 一 1998 标准 中 的 测试 计划 文档 内 容 进行 详细 的 描述 ,其 主要 内 容 
包括 : 

(1) 测试 计划 标识 (Test Plan Identifier) 。 

(2) 简介 (Introduction)。 

(3) 测试 对 象 或 测试 项 (Test Items)。 

(4) 需要 测试 的 特性 (Features to be Tested) 。 

(5) 不 需要 测试 的 特性 (Features not to be Tested) 。 

(6) 测试 方法 (Approach) 。 

(7) 测试 项 通过 /失败 准则 (Item Pass/Fail Criteria) 。 

(8) 暂停 准则 /恢复 要 求 (Suspension Criteria and Resumption Requirements) 。 

(9) 测试 交付 物 (Test Deliverables) 。 

(10) 测试 任务 (Testing Tasks)。 

(11) 环境 要 求 (Environmental Needs) 。 

(12) 职责 (Responsibilities) 。 
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(13) 人 员 配 备 和 培训 要 求 (Staffing and Training Needs) 。 
(14) 进度 (Schedule) 。 

(15) 风险 和 应 急 (Risks and Contingencies) 。 

(16) 批准 (Approvals) 。 


1. 测试 计划 标识 


测试 计划 标识 用 来 唯一 识别 测试 计划 文档 ,测试 计划 标识 和 文档 的 命名 必须 符合 组 
织 的 命名 规则 。 


2. 简介 


测试 计划 中 的 项 目 简要 介绍 ,可 以 使 阅读 测试 计划 的 人 员 了 解 基 本 的 项 目 信息 ,以 
及 帮助 他 们 查找 一 些 相关 的 信息 。 测 试 计 划 中 的 项 目 描述 是 对 测试 对 象 和 测试 目的 的 
简单 介绍 ,或 者 说 是 一 个 概要 的 全 景 图 。 

测试 计划 的 读者 除 测试 团队 成 员 之 外 ,还 包括 项 目 经 理 、 开 发 人 员 其 至 一 些 项 目的 
客户 。 为 了 帮助 他 们 理解 测试 计划 ,需要 在 测试 计划 中 包含 一 些 其 他 的 信息 ,例如 项 目 
的 一 些 其 他 文档 ,包括 项 目 计划 、 质 量 管理 计划 ,配置 管理 计划 等 。 也 需要 包括 和 项 目 相 
关 的 标准 和 准则 、 组 织 的 质量 方针 和 测试 方针 ,以 及 客户 相关 的 一 些 文档 等 。 


3. 测试 对 象 或 测试 项 


对 测试 对 象 或 者 测试 项 (其 中 包括 其 版 本 ) 的 详细 描述 ,主要 包含 以 下 内 容 : 

(1) 测试 依据 的 相关 文档 ,它们 是 测试 分 析 和 设计 的 基础 和 输入 。 文 档 包括 测试 对 
象 的 需求 和 设计 说 明 , 以 及 其 他 的 系统 相关 的 文档 。 

(2) 测试 对 象 包含 的 各 个 组 成 部 分 都 需要 进行 适当 的 描述 。 

(3) 测试 项 中 也 包含 了 开发 团队 如 何 向 测试 团队 提交 测试 对 象 和 测试 版 本 的 方式 。 
例如 通过 邮件 系统 、 服 务 器 、 网 页 下 载 等 。 

如 果 在 测试 过 程 中 需要 用 到 不 属于 测试 对 象 的 系统 组 件 , 则 在 测试 项 中 也 应 该 明确 
做 出 规定 。 


4. 需要 测试 的 特性 


标识 所 有 要 测试 的 软件 特性 及 其 组 合 , 并 标识 与 每 个 特性 或 特性 组 合 相关 的 测试 设 
计 说 明 。 同 时 规定 测试 过 程 中 需要 覆盖 的 功能 和 非 功能 属性 。 

为 了 保证 测试 对 象 的 可 跟踪 性 和 质量 特性 的 一 致 性 ,以 及 采用 的 测试 技术 的 可 行 
性 ,需要 定义 规范 的 质量 模型 ,例如 ISO/IEC 9126。ISO/IEC 9126 标准 将 软件 系统 分 成 
6 类 质量 特性 (更 多 关于 ISO/IEC 9126 的 内 容 参 见 1. 1. 4 节 )。 质 量 模型 有 助 于 定义 软 
件 特 性 的 功能 性 和 非 功能 性 ,以 及 采用 合适 的 测试 技术 .定义 合适 的 软件 测试 目标 和 测 
试 出 口 准则 。 
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5. 不 需 测 试 的 特性 


标识 所 有 不 需要 测试 的 软件 特性 以 及 不 需要 测试 的 特性 组 合 ,并 阐述 不 进行 测试 的 
原因 ,这 有 助 于 明确 测试 人 员 和 其 他 质量 保证 人 员 的 职责 。 

由 于 测试 计划 总 是 在 前 期 准备 就 绪 , 所 以 需要 测试 的 特性 和 不 需 测 试 的 特性 列表 可 
能 是 不 完善 的 。 随 着 项 目的 进展 ,会 发 现 有 些 组 件 或 者 特性 是 无 法 测试 的 ,或 者 需要 增 
加 某 些 组 件 、 特 性 ,或 特性 的 组 合 , 此 时 就 需要 修正 测试 计划 的 相应 内 容 。 


6. 测试 方法 


描述 测试 的 总 体 方法 。 对 于 每 个 主要 的 特性 和 特性 组 合 ,规定 要 确保 它们 得 到 充分 
测试 的 方法 ,规定 用 于 测试 制定 特性 组 所 需 的 主要 活动 .技术 和 工具 , 即 测试 方法 中 详细 
描述 了 测试 过 程 中 采用 的 各 种 方法 。 对 被 测 系统 的 每 个 功能 和 非 功能 特性 或 者 它们 的 
组 合 , 采 用 何 种 合适 的 测试 方法 来 保证 测试 覆盖 率 。 同 时 通过 采用 合适 的 测试 活动 、 测 
试 技 术 和 测试 工具 等 来 验证 这 些 软件 产品 的 特性 。 

确定 测试 方法 是 测试 计划 的 核心 内 容 。 测 试 方法 应 该 详细 地 描述 采用 的 方法 ,有 助 
于 对 主要 测试 任务 的 识别 以 及 相应 测试 工作 量 的 估算 。 测 试 方法 也 需要 规定 最 基本 的 
测试 覆盖 率 要 求 ,从 而 选择 合适 的 测试 技术 以 满足 测试 要 求 ,例如 要 求 获 盖 被 测 对 象 的 
每 条 语句 ,选择 语句 覆盖 率 是 合适 的 。 

测试 方法 中 也 需 描 述 测试 的 主要 限制 因素 ,例如 : 测试 项 是 否 能 够 及 时 交付 ,测试 资 
源 是 否 能 够 及 时 到 位 ,以 及 测试 的 截止 时 间 等 。 


7. 测试 项 通过 /失败 准则 


用 来 规定 每 个 测试 项 测试 通过 或 者 测试 失败 的 准则 。 为 了 更 好 地 实施 测试 ,这 里 主 
要 会 涉及 人 口 准则 .出口 准 则 以 及 测试 成 功 准则 。 

(1) 入 口 和 出 口 准则 

为 了 保证 测试 执行 的 顺利 进行 ,同时 也 是 为 了 在 整个 项 目 组 内 建立 共识 ,需要 确定 
什么 时 候 可 以 开始 测试 执行 .什么 时 候 可 以 结束 测试 执行 , 即 确定 入 口 准 则 和 出 口 准 则 。 
建立 测试 入口 准则 和 出 口 准则 ,有 助 于 测试 执行 的 顺利 进行 。 同 时 测试 人 员 在 测试 执行 
过 程 中 ,利用 这 些 准则 检查 当前 的 测试 状态 ,并 根据 不 同 的 测试 状态 ,采取 合适 的 应 对 措 
施 。 更 多 关于 入 口 准 则 和 出 口 准则 的 内 容 , 参 见 5. 2.3 和 5. 2.4 节 。 

(2) 测试 成 功 准 则 

测试 成 功 准则 是 指 系 统 或 组 件 通 过 规定 的 测试 所 必须 满足 的 准则 ,是 用 于 确定 一 个 
软件 系统 或 软件 特性 通过 测试 与 否 的 判定 准则 。 

测试 成 功 准则 可 以 根据 软件 组 织 内 统一 定义 的 测试 要 求 、 软 件 项 目 、 系 统 或 组 件 的 
具体 要 求 来 确定 ,或 者 根据 所 采用 的 测试 种 类 要 求 ,测试 用 例 设计 方法 来 确定 。 

不 同 的 测试 级 别 , 确 定 测试 成 功 准 则 的 依据 是 不 同 的 。 
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@ 组 件 测试 : 有关 详 细 描 述 组 件 功能 和 非 功能 特征 的 文档 (组 件 设计 文档 或 者 详细 
设计 文档 等 )。 

@ 集成 测试 : 有 关 详 细 描 述 组 件 或 子 系统 之 间接 口 和 详细 描述 组 件 或 子 系统 相互 
协调 工作 的 相关 文档 (例如 系统 概要 设计 文档 等 ) 。 

@ 系统 测试 : 有 关 详 细 描 述 用 户 的 需求 和 系统 所 应 该 具有 的 功能 和 非 功 能 特征 的 
相关 文档 (例如 用 户 需求 和 系统 设计 说 明 等 ) 。 

@ 验收 测试 : 用 户 / 客 户 的 合同 、 法 律 法 规 和 行业 行规 的 要 求 、 系 统 使 用 的 环境 要 
求 有 关系 统 的 各 种 说 明 等 。 

软件 测试 成 功 准则 的 依据 也 可 以 是 软件 组 织 内 统一 定义 的 测试 要 求 , 例 如 测试 缺陷 
指标 ,测试 获 盖 率 指标 ,测试 通过 率 指标 、 缺 陷 预 测 曲 线 ( 通 过 预测 曲线 可 以 大 概 预测 被 
测 系统 在 此 后 一 段 时间 内 新 发 现 缺 陷 的 数目 会 趋 于 平稳 /收敛 (例如 趋 于 0) ,或 被 测 系统 
在 此 后 一 段 时 间 内 新 发 现 缺 陷 的 数目 会 趋 于 不 断 上 升 /发 散 ( 例 如 指数 式 上 升 ) 等 ) 。 

软件 测试 成 功 准则 的 依据 也 可 以 根据 系统 所 采用 的 测试 方法 进行 分 类 ,例如 黑 盒 测 
试 的 成 功 准则 可 以 是 各 种 覆盖 率 要 求 , 如 测试 平台 的 覆盖 率 要 求 、 软 件 质量 特性 的 覆盖 
率 要 求 (功能 性 测试 、 易 用 性 测试 移植 性 测试 等 ); 白 盒 测试 的 成 功 准则 可 以 是 另外 的 覆 
盖 率 要 求 , 例 如 语句 获 盖 率 和 判定 获 盖 率 等 。 

下 面 是 测试 成 功 准则 的 具体 例子 。 

例子 1: 系统 的 最 大 瞬时 用 户 并 发 数 应 达到 5000 个 ,并 且 响 应 时 间 不 超过 0. 1s。 

例子 2: 所 有 选择 的 测试 用 例 必 须 至 少 执行 一 遍 ,测试 通过 率 不 得 低 于 95% ,并且 所 
有 严重 程度 为 1 和 2 的 缺陷 已 经 修复 且 经 过 相关 的 确认 测试 (再 测试 ) 和 回归 测试 。 

例子 3: 采用 语句 获 盖 率 设计 测试 用 例 , 语 句 覆 盖 率 必须 达到 100%。 

例子 4: 采用 边界 值 分 析 设 计 测试 用 例 ,边界 值 覆盖 率 必须 达到 100%。 


8. 暂停 准则 /恢复 要 求 


假如 测试 对 象 无 法 达到 测试 级 别 的 出 口 准则 ,而 继续 按照 测试 计划 进行 测试 可 能 就 
是 浪费 时 间 。 解 决 这 种 问题 的 一 种 方法 是 定义 和 应 用 测试 暂停 准则 和 恢复 要 求 ,或 者 对 
每 个 测试 级 别 定义 明确 的 测试 入 口 准则 。 同 时 这 些 和 人 口 准则 又 可 以 作为 重新 进行 相关 
测试 的 恢复 要 求 。 测 试 暂停 准则 和 恢复 要 求 的 概念 如 下 。 

(1) 暂停 准则 是 可 能 会 导致 测试 执行 暂停 ( 非 正 常 中 止 ) 的 状态 和 事件 。 例 如 ,测试 
执行 阶段 可 能 的 暂停 准则 有 : 

@ 所 需 的 测试 环境 没有 准备 完毕 。 

@ 测试 过 程 中 发 现 严重 问题 或 者 大 量 问题 ,以 至 于 继续 测试 没有 什么 意义 。 

(2) 恢复 要 求 是 可 以 继续 或 者 重新 进行 测试 的 状态 和 事件 。 例 如 ,测试 执行 阶段 可 
能 的 恢复 要 求 有 : 

Q@ 所 需 的 测试 环境 准备 完毕 。 

@ 测试 过 程 中 发 现 的 严重 问题 或 者 大 量 问题 已 经 解决 ,并 且 符合 测试 的 入 口 准 则 。 


第 5 章 ， 测 试管 理 Ny 


9. 测试 交付 物 


测试 计划 中 需要 明确 定义 在 测试 完成 后 需要 交付 的 文档 ,以 及 交付 的 文档 参考 的 标 
准 和 使 用 的 模板 。 

IEEE Std 829 一 1998 中 定义 了 测试 过 程 中 输出 的 一 些 文档 ,而 测试 数据 ,测试 工具 
和 测试 自动 化 脚本 等 也 应 该 作为 测试 交付 物 的 一 部 分 。 测 试 文档 和 其 他 项 目 开发 文档 
一 样 ,需要 进行 维护 和 版 本 控制 。 

测试 交付 物 主要 包括 : 

(1) 测试 计划 。 

(2) 测试 设计 说 明 。 

(3) 测试 用 例 说 明 。 

(4) 测试 规程 说 明 。 

(5) 测试 脚本 。 

(6) 测试 日 志 。 

(7) 测试 事件 报告 。 

(8) 测试 报告 。 

(9) 其 他 。 


10. 测试 任务 


标识 准备 和 执行 测试 所 需要 的 任务 集合 。 测 试 任务 将 测试 项 目 分 成 独立 的 测试 准 
备 活动 和 测试 执行 活动 。 同 时 ,测试 活动 的 相互 关系 和 内 外 影响 也 需要 在 这 里 加 以 
考虑 。 

测试 任务 中 除了 罗列 的 测试 活动 外 ,还 需要 标识 各 项 任务 之 间 的 依赖 关系 和 所 要 求 
的 任何 特殊 技能 。 跟 踪 测 试 活动 状 态 、 测 试 活动 的 实际 时 间 和 计划 时 间 的 比较 也 是 测试 
任务 部 分 需要 考虑 的 内 容 。 


11. 环境 要 求 


在 测试 计划 中 还 要 对 测试 活动 所 需 的 环境 进行 描述 ,包括 软件 的 需求 、 硬 件 的 需求 
和 所 需 的 工具 等 。 

测试 环境 的 需求 包括 : 

(1) 测试 平台 的 需求 (例如 服务 器 .终端 设备 .路 由 器 等 硬件 需求 ,操作 系统 和 其 他 的 
软件 需求 等 ) 。 

(2) 其 他 测试 的 前 置 条 件 ( 参 考 的 测试 数据 或 者 配置 数据 等 ) 。 

同时 需要 回答 下 面 的 这 些 问题 : 

(1) 测试 的 控制 点 是 什么 ? 例如 用 什么 接口 来 操作 测试 对 象 。 测 试 的 观察 点 是 什 
么 。 例 如 用 什么 接口 来 检查 测试 对 象 的 实际 反馈 。 
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(2) 需要 什么 样 的 辅助 软件 和 硬件 ?例如 监视 器 ,模拟 器 调试 器 和 信号 发 生 器 等 。 
(3) 采用 什么 方法 来 进行 测试 自动 化 ? 


12. 职责 


测试 活动 中 需要 明确 定义 测试 管理 ,测试 说 明 、 测 试 准备 ,测试 执行 和 测试 监控 等 测 
试 任务 的 相关 责任 人 。 其 他 的 一 些 职责 还 包括 内 部 测试 项 目 质量 保证 ,配置 管理 (包括 
测试 环境 配置 和 维护 )。 

测试 任务 的 相关 责任 人 可 以 是 开发 人 员 测试 人 员 、 用 户 代表 、 产 品 支 持 人 员 以 及 质 
量 管理 人 员 等 。 


13. 人 员 配 备 和 培训 要 求 


为 了 执行 测试 计划 中 的 测试 任务 ,根据 不 同人 员 的 技能 要 求 和 实际 的 技能 水 平 ,来 
开展 相关 的 软件 产品 .测试 过 程 、 测 试 工具 等 的 培训 。 


14. 进度 


在 项 目 开 始 阶段 ,需要 测试 进度 表 定 义 里 程 碑 式 的 测试 活动 。 由 于 测试 进度 经 常 变 
动 ,初始 的 项 目测 试 进度 表 只 是 作为 后 续 项 目测 试 活动 的 开始 点 ,同时 ,测试 活动 的 变动 
也 促使 项 目测 试 进度 的 更 新 。 


15. 风险 和 应 急 


在 测试 计划 中 不 仅 需要 识别 、 分 析 和 规避 或 减缓 测试 过 程 中 的 各 种 风险 ,最 大 限度 
地 保障 测试 过 程 的 质量 。 还 要 对 被 测 对 象 的 质量 风险 (产品 风险 ?进行 分 析 , 可 以 用 质量 
风险 信息 指导 测试 ,如 设 定 测试 条 件 或 测试 用 例 的 优先 级 、 选 择 测试 技术 和 测试 范围 等 。 
通过 测试 可 以 减少 被 测 对 象 中 的 风险 ,通过 测试 还 可 以 反馈 被 测 对 象 中 的 风险 信息 。 


16. 批准 


罗列 所 有 需要 批准 该 测试 计划 的 人 员 名 字 和 角色 。 

上 面 讲 解 了 IEEE Std 829 一 1998 中 规定 的 测试 计划 的 所 有 内 容 , 但 制订 测试 计划 时 
并 不 意味 需要 包括 上 述 的 所 有 内 容 , 而 应 该 结合 每 个 组 织 的 特点 和 每 个 产品 的 具体 情 
况 , 对 上 述 内 容 进行 相应 的 裁剪 。 


5.2.2 测试 计划 活动 
制订 良好 的 测试 计划 是 系统 化 测试 的 基础 ,测试 计划 对 此 后 的 测试 过 程 起 着 指导 性 


作用 。 测 试 计划 中 包括 了 如 下 的 各 种 活动 。 
(1) 确定 测试 的 范围 和 风险 ,明确 测试 的 目标 。 
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(2) 定义 测试 的 整体 方法 ,包括 确定 测试 级 别 、 定 义 入 口 准 则 和 出 口 准则 。 

(3) 把 测试 活动 集成 和 协调 到 整个 软件 生命 周期 活动 中 去 。 

(4) 确定 测试 什么 ,由 谁 来 执行 测试 ,如 何 进行 测试 ,如 何 评估 测试 结果 。 

(5) 为 测试 分 析 和 设计 活动 安排 时 间 进 度 。 

(6) 为 测试 实现 .执行 和 评估 安排 时 间 进 度 。 

(7) 为 已 定义 的 不 同 测试 任务 分 配 资源 。 

(8) 定义 测试 文档 的 数量 .详细 程度 、 结 构 和 模板 。 

(9) 监控 测试 准备 和 测试 执行 ,为 缺陷 修改 和 风险 管理 选择 度量 项 。 

(10) 确定 测试 规程 的 详细 程度 ,以 提供 足够 的 信息 支持 可 重复 的 测试 准备 和 执行 。 

测试 计划 的 制订 会 受到 很 多 因素 的 影响 ,例如 组 织 的 测试 方针 ,测试 范围 ,测试 目 
标 、 风 险 、 关 键 程度 、 可 测试 性 和 资源 的 可 用 性 等 。 随 着 项 目 和 测试 计划 的 不 断 推进 ,将 
有 更 多 的 信息 和 具体 细节 加 入 到 计划 中 。 

测试 计划 中 有 一 个 重要 的 测试 活动 是 确定 测试 执行 进度 。 测 试 资源 ,软件 质量 和 测 
试 时 间 之 间 是 相互 制约 的 ,因此 测试 执行 进度 的 制订 ,需要 在 这 三 者 之 间 进 行 平衡 。 例 
如 项 目 产品 发 布 的 时 间 是 确定 的 ,或 者 受到 市 场 或 客户 的 需求 的 制约 ,那么 在 有 限 的 时 
间 内 ,需要 平衡 有 限 的 测试 人 力 资源 和 其 他 的 测试 资源 来 制订 测试 进度 。 

很 多 因素 会 影响 测试 执行 进度 的 制订 ,主要 包括 : 

(1) 时 间 因 素 。 

(2) 人 力 资源 。 

(3) 软件 质量 。 

(4) 测试 文档 。 


1. 时 间 因 素 


制订 测试 进度 首先 需要 考虑 时 间 因 素 。 有 一 些 安全 关键 系统 ,它们 的 交付 时 间 受 客 
户 的 影响 比较 小 ,例如 航空 航天 、 医 疗 软件 等 ,在 进度 和 质量 发 生 冲突 的 时 候 , 它 们 更 侧 
重 于 质量 。 而 很 多 非 安 全 关键 系统 ,例如 手机 游戏 软件 ,由 于 激烈 的 市 场 竞 争 , 厂 家 都 希 
望 能 尽快 发 布 产品 ,或 者 客户 的 产品 发 布 时 间 已 经 确定 。 这 就 导致 在 制订 测试 时 间 进度 
的 时 候 ,产品 发 布 的 时 间 根 据 产品 生命 周期 或 者 客户 市 场 的 需要 已 经 确定 。 例 如 , 某 软 
件 产品 必须 在 12 月 31 日 前 交付 给 客户 ,所 有 的 开发 活动 和 测试 活动 的 进度 安排 都 必须 
围绕 这 个 时 间 点 进行 。 


2. 人 力 资源 
测试 活动 需要 由 相关 的 测试 人 员 来 完成 。 根 据 组 织 对 以 往 测试 活动 的 经 验 数据 ,以 
及 对 本 测试 规模 的 估算 ,来 确定 在 这 个 有 效 时 间 段 内 的 测试 人 员 数 目 和 其 他 的 测试 资 


源 。 例 如 ,在 测试 执行 过 程 中 ,该 组 织 测试 执行 的 经 验 数据 是 每 人 每 天 执行 4 个 测试 用 
例 , 如 果 指 定 的 测试 执行 时 间 是 20 个 工作 日 ,需要 执行 的 测试 用 例 数目 是 400 个 ,那么 
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从 这 些 数据 中 可 以 得 到 需要 的 测试 人 员 至 少 是 5 个 (400/(4X20))。 

测试 的 人 力 资源 除了 数量 上 的 要 求 ,还 包括 对 测试 人 员 具 有 的 技能 水 平 的 要 求 。 不 
同 的 项 目 需要 不 同 技 能 的 测试 人 员 。 常 见 的 测试 执行 时 需要 的 技能 包括 产品 相关 知识 、 
测试 工具 使 用 、 测 试 环境 搭建 测试 基本 理论 知识 和 技能 等 。 在 制订 测试 计划 时 需要 明 
确 测 试 人 员 应 该 具备 的 技能 。 如 果 发 现 测试 团队 缺乏 具备 相应 技能 的 人 员 ,需要 及 时 制 
订 招募 或 培训 计划 ,提高 团队 成 员 的 相关 技能 水 平 。 


3. 软件 质量 


在 定义 了 测试 执行 的 时 间 测试 执行 的 规模 (测试 用 例 数目 ?的 情况 下 ,得 到 了 需要 
的 测试 人 员 数 目 。 在 做 测试 计划 时 ,假定 5 个 测试 人 员 在 20 天 时 间 内 能 够 完成 400 个 测 
试用 例 。 在 实际 测试 过 程 中 ,可 能 会 发 现在 规定 时 间 内 无 法 或 很 难 完成 这 个 工作 量 , 也 
许 因为 在 测试 计划 中 没有 考虑 到 测试 过 程 中 发 现 期 望 结果 与 实际 结果 有 偏差 时 需要 对 
此 偏差 进行 分 析 和 评估 的 时 间 , 也 许 因为 没 考虑 发 现 缺 陷 后 需要 再 次 测试 以 确认 该 缺陷 
是 否 得 到 正确 修改 的 时 间 ,而 这 些 工作 都 需要 时 间 。 因 此 在 做 测试 计划 时 ,还 需要 考虑 
测试 过 程 中 可 能 发 现 的 缺陷 数目 ,然后 根据 组 织 的 缺陷 方面 的 经 验 数 据 来 估算 需要 花费 
的 时 间 。 在 制订 测试 计划 时 ,还 常常 会 遗漏 软件 缺陷 的 确认 测试 (再 测试 ) 以 及 回归 测试 
的 工作 量 ,导致 测试 后 期 的 测试 任务 非常 繁重 。 产 品 的 质量 ,文档 的 质量 .开发 过 程 的 成 
熟 度 、 个 人 的 能 力 等 都 会 极 大 地 影响 测试 的 进度 。 


4. 测试 文档 


完成 测试 执行 以 后 ,需要 提交 测试 报告 ,包含 测试 的 内 容 和 范围 .测试 存在 的 风险 、 
遗留 的 缺陷 (已 发 现 但 还 没 修改 的 缺陷 ) 以 及 相应 的 解决 方案 和 软件 质量 信息 等 ,所 以 在 
测试 计划 中 也 需要 包括 相关 文档 编写 的 工作 量 。 


5.2.3 入口 准则 


测试 执行 入 口 准则 指 的 是 允许 软件 系统 或 者 软件 产品 进入 测试 执行 阶段 所 必须 具 
备 的 条 件 。 也 就 是 说 ,提交 的 软件 系统 或 者 软件 产品 ,必须 满足 入 口 准则 定义 的 条 件 , 测 
试 团 队 才 可 以 进行 测试 执行 的 具体 工作 。 入 口 准则 的 定义 可 以 考虑 各 个 方面 的 因素 , 例 
如 针对 系统 测试 ,可 以 定义 下 面 的 一 些 条 目 作 为 测试 执行 的 入 口 准则 。 

(1) 测试 设计 说 明和 测试 用 例 说 明 已 经 编写 完成 并 且 通 过 评审 。 

(2) 自动 化 测试 用 例 验证 通过 (如 果 需 要 自动 化 测试 ) 。 

(3) 相关 的 测试 资源 和 测试 环境 准备 就 绪 ,包括 人 员 、 工 具 、 实 验 室 等 。 

(4) 开发 人 员 对 提交 的 版 本 进行 了 预测 试 并 且 预 测试 通过 (也 可 能 是 测试 团队 进行 
相关 版 本 的 预测 试 ) 。 

(5) 开发 人 员 提 交 版 本 说 明 , 包 括 该 版 本 中 新 增加 的 功能 特性 、 修 改 的 缺陷 .没有 修 
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改 的 缺陷 ,可 能 存在 的 问题 以 及 测试 重点 的 建议 等 。 

假如 开发 团队 的 软件 版 本 无 法 满足 测试 执行 的 入 口 准 则 ,测试 经 理 或 者 相关 负责 人 
可 以 拒绝 执行 测试 ,例如 测试 对 象 无 法 通过 预测 试 ,那么 测试 经 理 可 以 拒绝 开始 测试 执 
行 活动 。 


5.2.4 出 口 准则 


测试 出 口 准 则 的 目的 是 定义 什么 时 候 可 以 停止 测试 执行 ,例如 某 个 测试 级 别 的 结 
东 , 或 者 当 测 试 达到 了 规定 的 目标 。 

如 果 执 行 完 所 有 计划 的 测试 用 例 后 ,测试 出 口 准 则 的 一 个 或 多 个 条 目 还 没有 满足 ， 
一 个 方法 是 考虑 设计 更 多 的 测试 用 例 ,执行 更 多 的 测试 ,以 满足 出 口 准则 。 另 一 个 可 行 
的 方法 是 修改 测试 出 口 准则 。 如 果 需 要 增加 测试 用 例 , 需 要 注意 保证 新 的 测试 用 例 有 助 
于 满足 相应 的 出 口 准则 。 和 否则 ,额外 的 测试 用 例 只 会 增加 工作 量 而 不 会 对 满足 出 口 准 则 
有 任何 改进 。 

为 了 满足 出 口 准则 ,有 时 需要 采用 不 同 的 测试 技术 ,例如 测试 系统 对 某 异 常情 况 的 
响应 时 ,由 于 现行 的 测试 环境 不 能 够 引入 或 者 模拟 这 种 异常 情况 ,处 理 这 种 异常 情况 的 
代码 就 不 能 够 被 执行 和 测试 。 在 这 种 情况 下 ,应 当 使 用 其 他 的 测试 方法 (例如 静态 分 析 ) 
对 代码 进行 分 析 和 评估 。 

出 口 准则 主要 包含 

(1) 完整 性 测量 ,例如 代码 .功能 或 风险 的 覆盖 率 。 

(2) 对 缺陷 密度 或 可 靠 性 度量 的 估算 。 

(3) 成 本 。 

(4) 遗留 风险 ,例如 没有 被 修改 的 缺陷 或 在 某 些 部 分 测试 覆盖 率 不 足 。 

(5) 进度 表 , 例 如 基于 交付 到 市 场 的 时 间 。 


5.2.5 测试 估算 


测试 计划 中 要 确定 测试 时 间 进 度 和 安排 测试 资源 ,这 就 涉及 测试 估算 。 测 试 估算 的 
对 象 主要 包括 规模 .工作 量 和 进度 。 

(1) 测试 规模 估算 : 通常 指 的 是 测试 用 例 的 数目 ,而 不 是 软件 估算 中 的 代码 行 
(KLOC) 或 者 功能 点 。 

(2) 测试 工作 量 估 算 : 通常 采用 的 单位 是 人 年 (PY)、 人 月 (PM)、 人 周 (PW) 或 者 人 
天 (PD) 等 。 

(3) 测试 进度 估算 : 指 的 是 合理 安排 和 控制 测试 周期 ,测试 资源 和 测试 活动 顺序 之 
间 的 关系 。 

在 ISTQB 基础 级 大 纲 中 ,主要 考虑 针对 测试 工作 量 的 估算 。 因 此 本 章节 主要 针对 
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测试 工作 量 的 估算 进行 阐述 。 估 算 测 试 工作 量 有 以 下 两 种 常见 的 方法 。 

(1) 基于 度量 的 方法 : 根据 以 前 或 相似 项 目的 度量 值 来 进行 测试 工作 量 的 估算 ,或 
者 根据 典型 的 数据 来 进行 估算 。 

(2) 基于 专家 的 方法 : 由 任务 的 责任 人 或 专家 来 进行 测试 任务 工作 量 的 估算 。 

测试 估算 是 一 个 系统 化 和 不 断 持续 的 过 程 , 应 该 尽早 开始 。 在 对 项 目 有 所 了 解 的 情 
况 下 就 开始 进行 粗略 的 估算 , 随 着 对 系统 的 深入 了 解 和 相关 文档 的 齐全 ,在 后 续 阶 段 可 
以 进行 更 加 精确 的 估算 ,从 而 可 以 对 前 面 的 粗略 估算 进行 相应 的 更 新 和 修正 。 

高 精度 的 估算 很 困难 ,也 不 是 必需 的 。 软 件 项 目 中 的 合理 估算 ,可 以 帮助 项 目 人 员 
制订 进度 计划 ,并 使 工作 活动 尽量 满足 进度 表 。 


1. 影响 测试 工作 量 估算 的 因素 


一 般 来 说 ,软件 测试 工作 量 估算 是 基于 以 前 的 项 目 数据 和 组 织 层面 的 软件 测试 度量 
数据 ,例如 测试 效率 、 缺 陷 率 等 。 同 时 也 需要 考虑 测试 人 员 在 以 前 项 目 中 的 经 验 ,或 者 其 
他 人 员 的 经 验 。 测 试 工 作 量 估算 包含 两 方面 的 内 容 。 

(1) 和 测试 对 象 直接 相关 的 工作 量 , 例 如 软件 项 目 文档 的 学 习 和 评审 、 测 试 分 析 和 设 
计 、 测 试 实现 测试 执行 ,测试 环境 准备 .回归 测试 和 确认 测试 等 。 

(2) 和 测试 管理 相关 的 工作 量 , 例 如 测试 项 目 管理 ` 测 试 相关 的 配置 管理 ` 质 量 管理 
等 。 这 部 分 工作 量 在 实际 软件 测试 估算 中 经 常会 被 遗漏 ,导致 测试 团队 和 测试 人 员 在 测 
试 过 程 中 处 于 超 负荷 的 压力 之 下 。 

测试 工作 量 估算 过 程 中 ,需要 考虑 测试 团队 中 不 同 的 测试 人 员 之 间 的 经 验 和 能 力 水 
平 的 差异 ,也 就 是 说 需要 考虑 不 同 测试 人 员 的 效率 。 测 试 工作 量 估算 会 受到 很 多 因素 的 
影响 ,例如 如 下 几 个 因素 。 

(1) 产品 的 特点 : 软件 项 目 开 发 的 目的 是 提供 某 种 服务 或 者 某 种 产品 。 因 此 开发 的 
软件 系统 应 用 领域 的 复杂 度 .可靠 性 和 安全 性 方面 的 需求 等 ,是 相关 测试 工作 估算 的 重 
要 考虑 因素 。 例 如 对 于 航空 相关 的 软件 系统 和 游戏 相关 的 软件 系统 ,测试 工作 关注 的 重 
点 是 不 一 样 的 ,同样 也 会 影响 测试 工作 量 的 具体 估算 。 

(2) 开发 过 程 : 软件 开发 团队 的 稳定 性 .采用 的 开发 过 程 的 成 熟 度 .开发 过 程 使 用 的 
工具 等 都 会 对 测试 工作 量 的 估算 产生 影响 。 例 如 作为 测试 依据 的 系统 需求 说 明 、 系 统 设 
计 说 明和 其 他 工作 产品 的 质量 、 软 件 产 品 的 规模 等 都 会 影响 测试 工作 量 的 估算 。 

(3) 测试 过 程 : 测试 过 程 的 成 熟 度 等 级 组织 对 测试 的 重视 程度 等 ,也 是 测试 估算 需 
要 考虑 的 重要 因素 。 

(4) 项 目 参与 者 : 包括 项 目 系 统 人 员 、 开 发 人 员 测试 人 员 以 及 管理 人 员 等 ,他 们 的 
知识 和 技能 水 平 也 是 测试 估算 的 重要 输入 。 

为 了 提高 测试 工作 量 估 算 的 效率 和 有 效 性 ,需要 有 合适 的 估算 方法 支持 估算 的 

根据 以 前 或 相似 项 目的 度量 标准 来 进行 测试 工作 量 的 估算 ,或 者 根据 典型 的 数据 来 
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进行 估算 ,可 以 称 为 自 项 向 下 的 估算 方法 。 根 据 测试 任务 的 分 解 结 构 或 者 测试 活动 的 分 
类 ,进行 具体 测试 任务 工作 量 的 估算 ,可 以 称 为 自 底 向 上 的 估算 方法 。 


2. 自 项 向 下 的 估算 过 程 


自 顶 向 下 的 估算 过 程 首先 通过 功能 点 或 者 代码 行 (功能 点 和 代码 行 之 间 是 可 以 相互 
转换 的 ) 估 算 整个 软件 系统 的 工作 量 。 工 作 量 估算 中 需要 确定 团队 的 生产 效率 ,例如 测 
试 人 员 每 天 开发 的 测试 用 例 数 ,该 数据 可 以 通过 类 似 项 目的 数据 进行 估算 ,也 可 以 直接 
来 自 组 织 的 度量 数据 。 工 作 量 可 以 在 开发 生命 周期 的 每 个 阶段 ,按照 一 定 的 百分比 进行 
确定 (不 同 阶段 的 工作 量 百 分 比分 布 ,通常 也 是 从 组 织 的 过 程 数据 库 中 获得 的 ) 。 

自 顶 向 下 的 估算 过 程 应 该 根据 项 目 特定 因素 优化 工作 量 估算 ,以 保证 项 目的 唯一 性 
和 体现 不 同 的 项 目 特征 。 测 试 经 理 需要 确定 估算 过 程 中 需要 考虑 的 因素 ,以 避免 影响 最 
终 的 估算 准确 度 。 例 如 测试 中 工具 的 使 用 、 测 试 环境 的 稳定 性 、 人 员 的 技能 水 平等 都 可 
能 对 测试 的 工作 量 造 成 影响 。 

自 顶 向 下 的 估算 过 程 中 需要 利用 很 多 以 前 项 目的 经 验 数据 ,例如 组 织 内 的 平均 工作 
效率 。 同 时 它 也 和 组 织 内 采用 的 软件 开发 过 程 和 测试 过 程 紧 密 相关 ,例如 测试 过 程 是 否 
贯穿 于 整个 软件 开发 过 程 。 

假设 某 项 目 所 有 活动 计划 的 工作 量 是 42PW( 人 周 )。 根 据 组 织 内 对 测试 的 定位 ,以 
及 不 同 的 产品 类 型 ,依据 不 同 开发 活动 的 比例 ,得 到 测试 相关 的 工作 量 , 如 表 5-2 所 示 。 


表 5-2 各 个 开发 活动 的 工作 量 分 布 表 


ID 开发 活动 百分比 /% 工作 量 /PW 

Al 系统 架构 10 六 

A2 系统 设计 15 6.3 

A3 代码 实现 25 10.5 

A4 测试 活动 40 16.8 

A5 收尾 活动 10 4.2 
TOTAL 100 42 


因此 ,可 以 得 到 测试 工作 量 的 估算 结果 是 16. 8PW。 
3. 自 底 向 上 估算 方法 


自 底 向 上 的 估算 方法 通常 是 分 解 测试 过 程 .然后 进行 估算 的 一 种 方法 。 采 用 自 底 向 
上 的 估算 方法 ,测试 经 理 首 先 需要 将 测试 过 程 分 解 成 不 同 的 测试 活动 。 针 对 每 个 不 同 的 
测试 活动 或 者 测试 任务 定义 三 个 不 同 的 难 易 级 别 : 简单 .中 等 和 复杂 。 同 时 针对 每 个 测 
试 活动 得 到 它们 各 自 的 工作 量 估算 ,所 有 测试 活动 的 工作 量 之 和 就 是 整个 项 目的 总 的 测 
试 工 作 量 估算 。 

采用 自 底 向 上 估算 过 程 对 整个 项 目的 测试 工作 量 进行 估算 的 步骤 主要 如 下 。 

(1) 根据 组 织 的 标准 和 原则 将 测试 任务 或 测试 活动 按 简单 .中 等 和 复杂 进行 划分 。 
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(2) 根据 组 织 层面 的 过 程 数 据 库 或 者 类 似 项 目的 数据 ,确定 测试 团队 的 平均 度量 数 
据 ,例如 每 天 设计 的 测试 用 例 数 目 。 

(3) 确定 测试 用 例 数量 ,得 到 每 个 测试 活动 的 工作 量 估算 。 

(4) 所 有 测试 活动 或 测试 任务 的 总 和 ,就 是 项 目的 总 体 测试 任务 的 工作 量 估 算 。 

(5) 根据 项 目 特征 ,做 一 些 相应 的 修改 ,以 提高 工作 量 估算 的 准确 性 。 

自 底 向 上 的 估算 过 程 ,首先 需要 得 到 项 目 各 个 活动 或 者 任务 的 工作 量 估 算 , 从 而 整 
合 得 到 整个 项 目的 工作 量 估算 。 也 就 是 说 , 自 底 向 上 的 估算 过 程 得 到 的 整个 工作 量 是 由 
每 个 测试 工作 任务 组 成 的 。 自 底 向 上 的 估算 过 程 也 可 以 是 基于 活动 进行 的 。 在 这 种 情 
况 下 ,首先 估算 主要 测试 活动 的 工作 量 , 然 后 进行 非 主要 测试 活动 的 工作 量 估算 ,从 而 得 
到 整个 项 目的 测试 工作 量 估算 。 

尽管 软件 规模 对 很 多 测试 活动 的 工作 量 估算 也 起 到 重要 作用 ,但 是 这 个 方法 并 不 考 
虑 软件 的 规模 。 相 反 , 需 要 的 是 测试 任务 列表 ,一 般 而 言 ,确定 测试 任务 列表 相对 比较 容 
易 。 自 底 向 上 估算 方法 的 一 个 风险 是 可 能 在 测试 任务 列表 中 遗漏 一 些 任务 。 

如 图 5-1 所 示 。 以 某 网 上 购书 系统 为 例 , 讲 解 根据 测试 任务 进行 自 底 向 上 的 估算 过 
程 。 首 先 确定 网 上 购书 系统 中 测试 的 主要 功能 点 如 下 。 

(1) 前 台 销 售 系统 : 主要 包括 用 户 管理 .图 书展 示 、 图 书 检索 、 购 物 车 和 用 户 订单 几 
个 功能 模块 。 

(2) 后 台 管 理 系统 : 主要 包括 账户 管理 ,会 员 管 理 、 图 书 管理 .订单 管理 和 数据 统计 
几 个 功能 模块 。 
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图 5-1 网 上 购书 系统 功能 框图 


确定 了 测试 功能 点 之 后 ,实际 上 就 是 明确 了 测试 范围 , 接 下 来 确定 针对 这 些 测试 范 
围 需 要 进行 的 测试 活动 。 不 同 的 组 织 有 不 同 的 测试 策略 ,不 同 的 项 目 也 有 不 同 的 测试 活 
动 。 这 里 是 采用 ISTQB 标准 的 测试 过 程 活动 ,因此 在 这 个 网 上 购书 系统 中 ,测试 活动 包 
含 的 内 容 有 : 

(1) 测试 计划 和 控制 。 

(2) 测试 分 析 和 设计 。 

(3) 测试 实现 和 执行 。 

(4) 评估 出 口 准则 和 报告 。 

(5) 测试 结束 活动 。 
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最 后 是 确定 度量 和 度量 标准 ,可 以 根据 以 前 项 目的 经 验 和 数据 ,确定 测试 效率 。 例 
如 在 进行 静态 评审 时 ,评审 的 效率 是 20 页 /小 时 还 是 10 页 /小 时 ; 在 测试 用 例 设 计时 ,每 
天 设计 的 测试 用 例 数目 ; 测试 执行 时 ,每 天 执行 的 测试 用 例 数目 等 。 

根据 测试 活动 和 度量 数据 ,就 可 以 进行 详细 的 工作 量 估 算 , 这 就 是 自 底 向 上 的 工作 
量 估算 过 程 。 

在 进行 自 底 向 上 的 测试 估算 时 ,需要 考虑 以 下 因素 。 

(1) 测试 的 类 型 测试 用 例 的 数目 测试 对 象 的 复杂 程度 .测试 的 强度 等 。 

(2) 测试 环境 的 复杂 程度 和 可 控 程 度 ,以 及 测试 对 象 的 可 安装 程度 和 可 配置 管理 
程度 。 

(3) 根据 预期 的 缺陷 发 现 数 目 , 针 对 每 个 测试 级 别 , 估 算 确认 测试 和 回归 测试 的 工 
作 量 。 

(4) 测试 过 程 的 成 熟 度 , 测 试 过 程 中 采用 的 方法 ,技术 和 工具 的 复杂 程度 。 

(5) 测试 依据 的 质量 。 

(6) 测试 过 程 中 需要 输出 的 测试 工作 产品 以 及 其 质量 要 求 。 

(7) 其 他 项 目 历史 数据 和 当前 项 目的 相似 程度 。 

(8) 以 前 项 目 采 用 的 解决 方案 在 当前 项 目 中 的 可 重用 性 。 

(9) 被 测 系统 的 质量 , 若 被 测 系统 的 质量 非常 差 ,达到 测试 计划 中 定义 的 测试 出 口 准 
则 可 能 会 非常 困难 或 者 说 要 想 达 到 测试 出 口 准则 需要 付出 的 测试 工作 量 将 非常 巨大 。 

(10) 交付 被 测 系统 的 时 间 点 。 

(11) 已 经 完成 的 测试 级 别 或 测试 阶段 的 质量 情况 。 

在 进行 具体 的 工作 量 估算 时 ,也 需要 考虑 不 同 的 测试 活动 。 具 体 的 测试 活动 如 下 。 

(1) 测试 计划 : 制订 测试 计划 的 工作 量 和 时 间 要 求 ,以 及 测试 估算 本 身 的 工作 量 也 
应 该 考虑 在 内 。 

(2) 测试 分 析 和 设计 : 包括 测试 技术 和 测试 工具 学 习 、 测 试 设计 说 明和 测试 用 例 说 
明 的 编写 等 。 

(3) 测试 实现 : 包括 测试 数据 的 准备 、 测 试 环境 的 搭建 ,测试 用 例 实现 自动 化 ,测试 
规程 说 明 编 写 等 。 

(4) 测试 执行 : 包括 测试 用 例 执行 、 事 件 报告 提交 ,确认 测试 和 回归 测试 等 。 

(5) 测试 过 程 监控 : 包括 测试 度量 相关 的 数据 收集 和 分 析 、 出 口 准 则 评估 等 。 

(6) 测试 报告 : 包括 评估 测试 结果 、 编 写 测试 报告 等 。 

(7) 测试 结束 活动 : 包括 经 验 教 训 的 总 结 .测试 工作 产品 的 归档 等 。 

(8) 测试 人 员 培 训 : 包括 测试 技术 测试 过 程 .产品 应 用 领域 知识 和 测试 工具 等 方面 
的 培训 。 

(9) 项 目 成 员 之 间 的 沟通 : 包括 E-mail 沟通 、 项 目 状态 会 议 . 事 件 报告 会 议 、 变 更 控 
制 会 议 .部 门 会 议 等 。 

上 面 的 这 些 测试 工作 活动 ,测试 团队 必须 对 它们 进行 明确 的 识别 ,并 且 进 行 单独 的 
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估算 。 测 试 活动 需要 尽量 地 细 化 ,避免 出 现 单个 测试 活动 占用 太 多 工作 量 的 情况 。 测 试 
活动 粒度 太 大 的 话 ,一 方面 估算 的 偏差 可 能 扩大 , 另 一 方面 也 不 利于 后 面 的 监控 。 

有 些 测试 活动 的 估算 是 非常 困难 的 。 为 了 提高 估算 的 精度 ,必须 对 所 采用 的 估算 技 
术 和 假设 条 件 文档 化 ,记录 每 个 测试 活动 的 实际 工作 量 , 并 且 分 析 实 际 工作 量 和 估算 工 
作 量 之 间 的 偏差 以 及 偏差 的 原因 。 

另外 ,估算 还 与 测试 团队 的 成 熟 度 有 关 , 例 如 : 

(1) 测试 经 理 在 进行 测试 项 目的 工作 量 估算 时 ,需要 和 测试 团队 中 的 成 员 进 行 实时 
的 讨论 。 最 好 是 直接 召集 测试 任务 的 相关 责任 人 一 起 进行 具体 的 工作 量 估算 。 不 同 成 
员 估算 得 到 的 工作 量 可 以 进行 平均 取 值 ,或 者 分 别 将 工作 量 的 最 大 值 和 最 小 值 作为 测试 
工作 量 的 最 坏 情形 和 最 好 情形 。 

(2) 测试 工作 量 的 估算 不 仅仅 依赖 于 参与 估算 人 员 的 经 验 和 知识 水 平 ,同时 在 很 大 
程度 上 也 依赖 于 其 工作 热情 。 

(3) 组 织 的 质量 方针 和 测试 方针 同样 会 影响 测试 工作 量 的 估算 。 

(4) 被 测 软件 的 质量 和 开发 团队 的 成 熟 度 ,也 会 影响 测试 工作 量 的 估算 。 例 如 ,开发 
团队 成 熟 度 低 .充满 缺陷 的 软件 系统 ,需要 的 测试 工作 量 可 能 会 成 倍 地 增加 。 

不 管 是 自 顶 向 下 的 估算 过 程 还 是 自 底 向 上 的 估算 过 程 ,都 需要 得 到 一 些 项 目的 信 
息 。 对 自 顶 向 下 的 过 程 ,需要 项 目的 规模 信息 ; 对 自 底 向 上 的 过 程 ,需要 测试 工作 任务 列 
表 。 在 很 多 的 时 候 , 自 项 向 下 的 估算 过 程 和 自 底 向 上 的 估算 过 程 是 互补 的 。 两 者 的 共同 
点 是 随 着 项 目的 进展 ,得 到 的 项 目 信 息 越 多 ,相应 的 估算 准确 性 越 高 。 例 如 ,在 测试 计划 
阶段 ,估算 测试 规模 很 困难 ,并 且 精 度 不 高 ,但 在 测试 设计 完成 后 ,估算 应 该 会 更 精确 。 


5.2.6 测试 策略 /测试 方法 


在 特定 项 目 中 ,测试 方法 是 测试 策略 的 具体 实现 。 测 试 方法 是 在 测试 计划 和 设计 阶 
段 中 被 定义 并 逐步 细 化 的 。 它 通常 取决 于 (测试 ) 项 目 目标 和 风险 评估 。 它 是 规划 测试 
过 程 、 选 择 测试 设计 技术 和 应 用 的 测试 类 型 以 及 定义 入 口 准则 和 出 口 准则 的 起 点 。 

测试 方法 的 选择 取决 于 实际 情况 ,应 当 考 虑 风险 .危害 和 安全 ,可 用 资源 和 人 员 技 
能 ,技术 ,系统 的 类 型 (例如 客户 定制 与 商业 现货 软件 的 比较 ) ,测试 对 象 和 相关 法 规 。 

典型 的 测试 方法 包括 : 

(1) 分 析 的 方法 (Analytical approaches) .例如 基于 风险 的 测试 ,首先 针对 风险 最 高 
的 部 分 进行 测试 。 

(2) 基于 模型 的 方法 (Model-Based Approaches) ,例如 随机 测试 .利用 失效 率 (如 可 
靠 性 增长 模型 ) 或 使 用 率 ( 如 运行 概况 ) 的 统计 信息 。 

(3) 系统 的 方法 (Methodical Approaches) ,例如 基于 失效 的 方法 (包括 错误 推测 和 故 
障 攻击 ) ,基于 检查 表 的 方法 和 基于 质量 特征 的 方法 。 

(4) 基于 过 程 或 符合 标准 的 方法 (Process-Based or Standard Approaches) ,例如 在 行 


第 5 章 “测试 管理 NY 


业 标 准 中 规定 的 方法 或 各 类 敏捷 方法 。 

(5) 动态 和 启发 式 的 方法 (Dynamic and Heuristic Approaches) ,类 似 于 探索 性 测试 ， 
测试 人 员 依 赖 于 事件 而 非 提 前 计划 ,而 且 执 行 和 评估 几乎 是 同时 进行 的 。 

(6) 咨询 式 的 方法 (Consultative Approaches) ,例如 测试 覆盖 率 主 要 是 根据 测试 小 
组 以 外 的 业务 领域 和 /或 技术 领域 专家 的 建议 和 指导 来 推动 的 。 

(7) 可 重用 的 方法 (Regression-averse Approaches) ,例如 重用 已 有 的 测试 材料 .广泛 
的 功能 回归 测试 的 自动 化 ,标准 测试 套件 等 。 

上 面 这 些 典 型 的 测试 方法 并 不 是 孤立 存在 的 ,测试 过 程 中 应 该 根据 实际 情况 组 合 应 
用 不 同 的 测试 方法 ,例如 在 基于 质量 特性 的 基础 上 ,采用 基于 风险 的 测试 。 组 织 选 定 的 
测试 方法 应 符合 其 需要 ,并 可 根据 其 特定 的 业务 或 项 目 特点 进行 合理 的 组 合 或 裁剪 , 例 
如 基于 风险 的 动态 方法 。 

如 果 测 试 方法 描述 了 (项 目 和 产品 ) 风 险 , 以 及 在 测试 过 程 中 如 何 管理 这 些 风险 , 那 
么 需要 对 风险 和 测试 之 间 的 关系 进行 解释 ,并 说 明 风 险 应 对 和 风险 管理 的 可 选 方案 。 

测试 方法 还 可 以 描述 要 执行 的 测试 级 别 。 在 这 种 情况 下 ,应 给 出 制定 每 个 测试 级 别 
的 入 口 准则 和 出 口 准则 的 概要 指导 ,以 及 不 同 测试 级 别 之 间 的 关系 (例如 不 同 的 测试 级 
别 对 应 不 同 的 测试 覆盖 率 目 标 )。 


G6.3 测试 过 程 的 监控 


测试 过 程 贯 穿 于 整个 软件 开发 生命 周期 ,测试 人 员 以 提交 缺陷 报告 的 形式 ,向 开发 
人 员 生 成 变更 请 求 或 者 修复 请 求 。 开 发 人 员 修 复 缺 陷 之 后 ,测试 人 员 基 于 新 的 版 本 软 
件 ,进行 确认 测试 (再 测试 ) 和 回归 测试 。 在 每 个 测试 级 别 ,测试 过 程 都 会 重复 进行 。 测 
试 经 理 负责 发 起 、 监 视 和 控制 这 些 测试 周期 。 

根据 项 目的 规模 ,可 能 由 单独 的 测试 经 理 来 负责 每 个 测试 级 别 的 测试 。 本 节 主 要 包 
括 如 下 内 容 。 

(1) 测试 过 程 监视 。 

(2) 测试 报告 。 

(3) 测试 控制 。 


5.3.1 测试 过 程 监视 


测试 过 程 监视 的 目的 是 为 测试 控制 提供 反馈 信息 和 可 视 性 。 监 视 的 信息 可 以 通过 
手工 或 自动 的 方式 进行 收集 .同时 这 些 信息 可 以 用 来 衡量 测试 计划 中 定义 的 出 口 准则 ， 
例如 测试 覆盖 率 。 也 可 以 用 度量 数据 对 照 原 计 划 的 时 间 进度 和 预算 来 评估 测试 的 进度 。 
常用 的 测试 度量 指标 有 : 
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(1) 测试 用 例 准 备 工作 完成 的 百分比 (或 按 计划 已 编写 的 测试 用 例 的 百分比 ) 。 

(2) 测试 环境 准备 工作 完成 的 百分比 。 

(3) 测试 用 例 执行 情况 (例如 执行 /没有 执行 的 测试 用 例 数 ,通过 /失败 的 测试 用 
例 数 ) 。 

(4) 缺陷 信息 (例如 缺陷 密度 ,发 现 并 修改 的 缺陷 、 失 效率 、 重 新 测试 的 结果 )。 

(5) 需求 .风险 或 代码 的 测试 覆盖 率 。 

(6) 测试 人 员 对 产品 的 主观 信心 。 

(7) 测试 里 程 碑 的 日 期 。 

(8) 测试 成 本 ,包括 寻找 下 一 个 缺陷 或 执行 下 一 轮 测试 所 需 成 本 与 收益 的 比较 。 

通过 测试 过 程 监视 活动 ,可 以 收集 测试 时 间 进 度 .资源 、 成 本 和 产品 质量 等 信息 ,这 
些 信 息 将 有 利于 在 测试 控制 活动 中 做 出 正确 的 决定 。 下 面 重点 介绍 如 何 对 测试 用 例 和 
缺陷 这 两 类 信息 进行 监视 。 


1. 测试 用 例 


测试 过 程 中 监视 测试 用 例 的 执行 情况 ,有 助 于 评估 测试 执行 进度 ,例如 测试 执行 是 
否 有 延迟 ,是 否 需 要 增加 测试 资源 等 。 评 估 测 试 执行 进度 时 ,常用 的 度量 信息 有 : 

(1) 计划 执行 的 测试 用 例 数目 。 

(2) 实际 执行 的 测试 用 例 数目 。 

(3) 测试 通过 的 测试 用 例 数目 。 

(4) 测试 失败 的 测试 用 例 数目 。 

(5) 被 阻塞 的 测试 用 例 数目 。 

表 5-3 是 一 个 测试 执行 状态 的 例子 。 


表 5-3 测试 执行 状态 评估 


模块 计划 执行 执行 率 通过 通过 率 失败 阻塞 
模块 1 70 65 92.86% 55 78.57% 10 0 
模块 2 90 90 100.00% 70 77.78% 20 0 
模块 3 60 37 61.67% 35 58.33% 3; 10 
模块 4 50 47 94.00% 45 90.00% 2 0 
模块 5 100 97 97.00% 95 95.00% 2 0 
模块 6 30 30 100.00% 29 96.67% 0 
模块 7 80 66 82.50% 65 81.25% 1 0 
模块 8 90 81 90.00% 80 88. 89% 1 9 
合计 570 513 90.00% 474 83.16% 39 19 


根据 上 面 的 测试 用 例 执行 状态 的 例子 中 提供 的 信息 ,经 常会 被 问 到 下 面 的 这 些 问 
题 : 当前 的 测试 进度 与 测试 计划 比较 ,测试 任务 是 否 有 延迟 ; 是 否 需要 变更 测试 计划 ; 后 
续 的 测试 重点 是 什么 等 。 

上 述 例 子 中 ,假设 测试 执行 时 间 为 10 周 , 当 前 表格 提供 的 是 测试 截止 时 间 前 一 周 的 
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数据 , 即 测试 时 间 剩余 1 周 。 测 试 团队 和 其 他 项 目 团队 在 分 析 该 测试 执行 状态 表 时 ,能 
够 得 到 一 些 什么 样 的 信息 ,如 何 来 指导 后 续 的 测试 执行 。 

(1) 测试 任务 能 按时 完成 吗 ? 总 共 的 测试 时 间 是 10 周 ,剩余 时 间 1 周 。 根 据 表格 中 
提供 的 数据 ,时 间 已 过 去 90% ,执行 的 测试 用 例 的 数目 也 是 90% ,感觉 时 间 进 度 刚好 。 
但 是 ,实际 情况 是 : 除了 没有 执行 的 57 个 测试 用 例 之 外 ,还 有 39 个 测试 用 例 执行 没有 通 
过 (失败 ), 以 及 19 个 测试 用 例 被 阻塞 。 由 于 在 剩余 的 1 周 时 间 内 除了 需要 完成 没有 执 
行 的 测试 用 例 之 外 ,还 有 其 他 测试 用 例 需 要 确认 测试 (再 测试 ) 和 回归 测试 ,因此 ,剩余 的 
1 周 时 间 完 成 这 些 测 试 任务 比较 困难 。 制 订 测 试 计划 和 测试 进度 表 时 ,对 测试 过 程 中 发 
现 缺陷 的 重 现 、 修 改 缺 陷 之 后 的 确认 和 回归 测试 ,经 常 容易 被 忽视 ,从 而 导致 测试 项 目 在 
最 后 的 阶段 往往 会 延期 ,或 者 对 测试 造成 很 大 压力 。 

(2) 模块 1 和 模块 2 中 发 现 的 缺陷 数目 特别 多 , 即 测 试 通过 率 很 低 。 根 据 测 试 中 的 
缺陷 集群 效应 ,模块 1 和 2 应 该 是 后 续 的 测试 重点 。 同 时 需要 分 析 缺 陷 多 的 根本 原因 ， 
例如 没有 重视 需求 阶段 的 评审 活动 ,没有 认真 执行 组 件 测试 ,模块 采用 了 全 新 的 技术 、 参 
与 模块 开发 的 开发 人 员 技 能 上 有 差距 (例如 是 新 员工 ) 等 。 通 过 缺陷 的 根本 原因 分 析 得 
到 的 结果 ,有 助 于 改进 软件 开发 过 程 和 测试 过 程 ,持续 提高 测试 效率 有效 性 和 测试 
质量 。 

(3) 模块 3 中 被 阻塞 的 测试 用 例 比较 多 ,需要 分 析 被 阻塞 的 原因 ,例如 是 否 由 于 被 测 
模块 中 存在 严重 的 缺陷 无 法 解决 ,而 导致 很 多 相应 的 测试 用 例 无 法 执行 。 假 如 是 这 种 情 
况 ,修复 该 缺陷 的 优先 级 需要 提高 ,督促 开发 人 员 抓 紧 时 间 进 行 分 析 和 修改 ,否则 ,将 严 
重 影响 测试 的 进度 ,从 而 影响 项 目的 最 终 发 布 时 间 。 


2. 缺陷 


缺陷 是 测试 过 程 中 最 重要 的 输出 之 一 ,包括 前 期 文档 评审 过 程 中 发 现 的 缺陷 ,各 个 
测试 阶段 发 现 的 缺陷 ,以 及 在 用 户 使 用 中 发 现 的 缺陷 等 。 通 过 缺陷 分 析 和 评估 ,有 助 于 
了 解 被 测 对 象 的 质量 ,也 可 以 用 来 评估 被 测 对 象 的 可 靠 性 ,例如 预测 被 测 对 象 的 可 靠 性 
的 变化 趋势 。 同 时 ,也 可 以 用 来 帮助 确定 测试 重点 ,以 及 评估 测试 是 否 达 到 了 测试 出 口 
准则 等 。 

测试 过 程 中 经 常 收集 的 缺陷 信息 有 各 种 缺陷 状态 的 累计 数量 .新 提交 的 缺陷 和 已 
修复 缺陷 之 间 的 比值 关系 、 新 提交 缺陷 和 已 关闭 缺陷 之 间 的 比值 关系 、 缺 陷 不 同 优先 
级 的 分 布 情况 、 缺 陷 不 同 严重 程度 的 分 布 情况 等 。 以 下 是 几 种 常用 的 分 析 缺 陷 的 度量 
指标 。 

(1) 缺陷 检测 效率 DDE(Defect Detected Efficiency): DDE 二 E/CE 十 D) ,其 中 ,已 
为 软件 交付 之 前 发 现 的 缺陷 数目 .D 为 交付 后 发 现 的 缺陷 数目 。 缺 陷 检 测 效率 DDE 是 
定义 过 程 效率 和 项 目 质量 的 主要 度量 。 团 队 的 目标 是 努力 实现 DDE 二 1, 虽 然 这 个 很 困 
难 。 根 据 以 前 项 目的 DDE 数值 ,可 以 估算 当前 项 目的 DDE, 并 且 指导 具体 测试 活动 。 实 
际 上 DDE 不 仅仅 可 以 应 用 于 整个 软件 开发 过 程 , 同 时 也 适用 于 软件 开发 过 程 中 的 任何 
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一 个 阶段 或 者 活动 。 这 是 考核 测试 完成 质量 的 一 个 重要 指标 。 

(2) 缺陷 移 除 效率 DRE(Defect Removal Effectiveness): DRE 一 R/D, 其 中 ,R 为 
关闭 的 缺陷 数目 ,D 为 发 现 的 总 缺陷 数目 。DRE 是 衡量 开发 修正 缺陷 效率 的 一 个 主要 指 
标 。 目标 是 使 DRE 二 1。 

(3) 静态 测试 发 现 缺 陷 比例 : 静态 测试 发 现 的 缺陷 占 整 个 测试 团队 发 现 的 缺陷 
比例 。 

(4) 测试 效率 (Test Efficiency) : 指标 可 以 是 发 现 一 个 缺陷 需要 花费 多 少 人 小 时 。 

(5) 基于 代码 行 的 测试 有 效 性 : 指标 可 以 是 每 千 行 代码 发 现 的 缺陷 数目 。 

(6) 基于 测试 用 例 的 测试 有 效 性 : 指标 可 以 是 每 个 测试 用 例 发 现 的 缺陷 数目 。 

缺陷 信息 可 以 通过 缺陷 管理 系统 进行 收集 ,通过 分 析 和 评估 这 些 信息 ,可 以 回答 测 
试 过 程 中 的 问题 。 例 如 是 否 满足 了 测试 计划 中 设置 的 测试 目标 ,是 否 发 现 了 足够 多 的 缺 
陷 , 哪 个 测试 阶段 或 级 别 发 现 的 缺陷 数目 最 多 ,是 否 满足 了 测试 出 口 准则 或 者 是 否 可 以 
结束 测试 。 下 面 通 过 具体 的 例子 ,对 缺陷 度量 的 信息 进行 分 析 。 

1) 缺陷 按 阶段 分 布 

图 5-2 是 组 织 层面 发 现 的 缺陷 在 不 同 阶段 的 分 布 图 。 它 代表 的 是 一 个 组 织 的 能 力 曲 
线 ,而 不 是 某 个 具体 项 目的 数据 ,是 进行 具体 项 目 分 析 和 评估 的 基础 。 图 中 的 横 坐 标 表 
示 开 发 生命 周期 的 各 个 阶段 ; 图 中 的 纵 坐 标 可 以 是 缺陷 的 个 数 ,也 可 以 是 按照 缺陷 的 严 
重 程度 分 配 不 同 的 权重 而 得 到 的 数值 。 


30 


号 
| 


评审 [单元 测试 [各 成 测试 [系统 测试 [到 收 测试 | 用户 反 饮 
E 缺陷 数 | 90 75 55 | 40 10 
一 一 累计 数 | ”90 165 220 | 260 270 274 


5-2 缺陷 按 发 现 阶段 分 布 图 


2) 基于 缺陷 状态 的 累计 缺陷 数目 

图 5-3 是 每 周 得 到 的 基于 缺陷 状态 的 累计 缺陷 数目 统计 。 针 对 累计 缺陷 数目 的 统计 
信息 ,可 以 考虑 以 下 两 个 方面 问题 。 

(1) 总 的 缺陷 数目 的 变化 趋势 ,是 明显 增加 还 是 趋 于 平缓 。 

(2) 已 解决 的 缺陷 数目 的 变化 趋势 。 如 果 已 解决 的 缺陷 数目 增加 很 快 ,说 明 有 很 多 
已 经 修复 的 缺陷 正 等 待 测试 人 员 的 确认 测试 ,并 考虑 相应 的 回归 测试 。 
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748 | 749 | 750 | 751 | 752 


关闭 | 0 | 0 | 
解决 | 0 | 5 |10|30|50|57 
mmm 分析 中 | 10 | 30 | 
ea 新 提交 
一 总 计 12 | 45 


85 100 | 131 162 | 203 
55 50 50 55 45 
70 65 40 30 25 


© 
三 
已 
名 
全 
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265 | 270 | 271 287 | 303 


图 5-3 基于 缺陷 状态 的 累计 缺陷 数目 统计 


3) 基于 缺陷 严重 程度 的 累计 缺陷 数目 

图 5-4 是 基于 缺陷 严重 程度 的 累计 缺陷 数据 统计 。 根 据 这 个 数据 统计 ,可 以 得 到 的 
信息 是 严重 程度 为 1 和 2 的 缺陷 数目 在 总 的 缺陷 数目 中 的 比例 ,从 而 确定 是 否 需要 更 多 
的 资源 解决 这 些 问题 ,这些 缺陷 是 不 是 会 影响 后 续 的 测试 任务 ,以 及 这 些 缺 陷 对 客户 的 
影响 程度 等 。 


742 | 743 | 744 |745 | 746 | 747 | 748 |749 | 750 | 751 | 752 


me "重度 3 2 5 8 15 19 22 25 26 26 27 27 
Ea "重度 4 10 30 70 105 | 200 | 220 | 240 | 250 | 260 | 266 | 270 
一 一 总 计 16 38 79 123 | 222 | 246 | 265 | 278 | 286 | 293 | 298 


5-4 基于 缺陷 严重 程度 的 累计 缺陷 数据 统计 


4) 基于 不 同 阶段 的 缺陷 分 布 

图 5-5 是 基于 不 同 的 阶段 得 到 的 缺陷 分 布 情况 ,包括 在 评审 、 组 件 测试 、 集 成 测试 、 系 
统 测试 .验收 测试 和 用 户 反 馈 阶 段 的 缺陷 数目 。 根 据 图 5-5 中 的 缺陷 分 布 情况 ,可 以 计算 
早期 发 现 缺 陷 的 比例 ,同时 也 可 以 计算 缺陷 检测 效率 。 
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图 5-5 基于 阶段 的 缺陷 分 布 统计 


5) 基于 组 件 的 缺陷 分 布 

图 5-6 是 基于 不 同 组 件 得 到 缺陷 数目 的 统计 。 根 据 不 同 组 件 发 现 缺 陷 数 目的 统计 ， 
可 以 确定 什么 组 件 中 发 现 的 缺陷 数量 比较 多 ,或 者 哪个 组 件 中 发 现 的 缺陷 和 预测 的 缺陷 
数目 相差 很 大 。 根 据 测试 的 集群 效应 ,大 部 分 缺陷 集中 在 少 部 分 组 件 中 。 同 时 需要 分 析 
产生 这 个 现象 的 原因 : 是 因为 这 个 组 件 的 设计 采用 了 新 的 技术 ,还 是 在 前 期 的 评审 、 组 件 
测试 中 没有 很 好 地 把 握 质 量 , 或 是 由 于 开发 人 员 没 有 经 验 等 。 


登录 
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图 5-6 基于 组 件 的 缺陷 分 布 状态 


6) 基于 测试 类 型 的 缺陷 分 布 

图 5-7 是 基于 测试 类 型 得 到 的 缺陷 分 布 状态 。 对 缺陷 按照 测试 类 型 分 布 的 分 析 有 助 
于 了 解 测试 的 充分 性 和 产品 的 质量 。 例 如 虽然 在 基本 功能 方面 发 现 了 大 量 的 缺陷 ,但 是 
在 兼容 性 、 性 能 等 其 他 方面 基本 没有 发 现 缺 陷 , 这 种 情况 下 虽然 发 现 的 缺陷 数量 很 大 ,但 
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是 并 不 能 说 明 已 经 测试 充分 ,一 些 针 对 产品 非 功 能 性 的 测试 很 有 可 能 没有 运行 或 者 测试 
不 充分 。 


图 5-7 基于 测试 类 型 的 缺陷 分 布 状态 


5.3.2 测试 报告 


测试 报告 指 的 是 对 软件 系统 或 组 件 进行 测试 产生 的 行为 及 结果 的 描述 文件 。 测 试 
报告 以 文档 的 形式 ,描述 了 被 测 对 象 的 测试 情况 和 测试 结果 ,并 对 相关 的 结果 和 数据 进 
行 分 析 , 向 管理 层 提供 信息 和 建议 。 测 试 报告 是 测试 活动 的 一 个 重要 输出 ,必须 得 到 管 
理 层 的 批准 ,才能 够 成 为 正式 的 测试 文档 。 

由 于 测试 的 级 别 不 同 ,测试 报 告 的 内 容 有 所 不 同 。 例 如 组 件 测试 报告 .集成 测试 报 
告 、 系 统 测试 报告 .验收 测试 报告 ,这 些 报告 在 提交 人 、 读 者、 报告 产生 的 阶段 、 报 告 的 关 
注 点 ,报告 的 依据 和 报告 审核 人 方面 可 能 各 不 相同 。 

测试 报告 中 描述 的 结论 来 自 相关 测 试 活动 的 记录 文档 ,而 不 是 凭空 得 出 的 。 测 试 报 
告 需要 参考 的 文档 也 会 因 不 同 的 测试 级 别 而 有 所 差别 ,主要 可 以 参考 的 文档 有 测试 计 
划 、 测 试 设计 说 明 ,测试 用 例 说 明 、 测 试 规程 说 明 、 事 件 报告 和 测试 日 志 等 。 测 试 报告 中 
需要 对 度量 数据 进行 分 析 , 例 如 测试 用 例 执 行 度量 数据 、 缺 陷 度 量 数据 、 获 盖 率 度量 数 
据 等 。 


5.3.3 测试 控制 


测试 控制 是 对 整个 测试 过 程 ( 计 划 、 分 析 和 设计 、 实 现 和 执行 .评估 出 口 准则 和 测试 
报告 .测试 结束 ) 进 行 控制 ,根据 测试 计划 以 及 收集 和 报告 的 测试 信息 采取 应 对 措施 。 应 
对 措施 可 以 针对 任何 测试 活动 ,也 可 以 包括 软件 开发 过 程 中 的 其 他 活动 。 下 面 通过 一 些 
例子 来 说 明 测 试 控制 活动 是 如 何 开展 的 。 
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通常 来 讲 , 系 统 测试 用 例 对 系统 需求 的 覆盖 率 要 达到 100%。 当 测试 用 例 设 计 完 成 
后 评估 这 个 覆盖 率 , 如 果 没 有 达到 100% 的 覆盖 率 ,就 需要 针对 遗漏 的 需求 增加 测试 用 
例 ,以 保证 测试 用 例 对 需求 的 覆盖 率 达 到 100%。 就 算 达 到 对 所 有 需求 100% 的 柳 盖 ， 
不 能 保证 测试 的 完整 。 还 要 考虑 需求 项 的 组 合 ,需求 项 的 正 向 测试 (有 效 性 测试 ) 和 逆向 
测试 (无 效 性 测试 /健壮 性 测试 ) 等 。 在 实际 测试 中 ,可 能 需要 多 个 测试 用 例 获 盖 同一 个 

如 果 在 测试 执行 过 程 中 被 测试 版 本 在 基本 功能 方面 经 常 发 现 缺 陷 ,导致 很 长 一 段 时 
间 内 大 量 的 测试 用 例 无 法 执行 ,严重 影响 测试 进度 。 在 这 种 情况 下 ,可 以 暂停 测试 ,同时 
对 恢复 准则 进行 更 新 。 也 可 以 采用 骨 烟 测试 (预测 试 ) 方 法 : 测试 团队 和 开发 团队 共同 挑 
选 一 些 获 盖 基 本 功能 的 测试 用 例 , 每 次 当 被 测试 版 本 提交 测试 团队 进行 正式 测试 之 前 ， 
必须 保证 这 些 预 测试 的 测试 用 例 全 部 通过 。 由 于 这 些 预 测试 的 测试 用 例 是 从 原来 的 测 
试用 例 中 挑选 的 ,所 以 预测 试 通过 后 ,对 应 的 一 些 测 试用 例 就 可 以 直接 标识 为 测试 通过 ， 
避免 同样 的 测试 用 例 被 重复 执行 。 

如 果 在 测试 执行 过 程 中 对 缺陷 进行 分 析 时 ,发现 的 缺陷 大 部 分 是 功能 性 的 ,而 不 是 
非 功能 性 的 (如 兼容 性 ,性 能 、 可 移植 性 等 方面 的 缺陷 )。 这 种 情况 下 ,就 需要 对 执行 的 测 
试用 例 进 行 分 析 : 是 因为 软件 版 本 质量 比 预期 的 好 ,还 是 因为 缺乏 相应 的 非 功能 性 测试 
用 例 。 如 果 是 由 于 测试 用 例 不 完善 造成 的 , 则 需要 对 测试 用 例 进 行 补 充 。 


66.4 配置 管理 


配置 管理 的 目的 是 在 整个 项 目 和 产品 的 生命 周期 内 ,保障 并 维护 软件 或 系统 产品 
(组 件数 据 和 文档 ?的 完整 性 。 配 置 管理 往往 包含 了 版 本 控制 、. 变 体 控 制 . 访 问 控制 以 及 
配置 控制 。 

对 测试 而 言 , 采 用 配置 管理 可 以 确保 : 

(1) 测试 件 (Testware) 的 所 有 相关 项 都 已 经 被 识别 .版 本 受 控 ,它们 相互 之 间 有 关联 
的 变更 ,以 及 和 开发 项 (测试 对 象 ) 之 间 有 关联 的 变更 都 可 跟踪 ,从 而 保证 了 可 追溯 性 。 

(2) 在 测试 文档 中 ,所 有 被 标识 的 文档 和 软件 项 能 被 清晰 明确 地 引用 。 

对 于 测试 人 员 来 说 ,配置 管理 可 以 帮助 他 们 唯一 地 标识 (并 且 复 制 ) 测 试 项 ,测试 文 
档 ,测试 用 例 和 测试 用 具 (Test Harness) 。 

在 测试 计划 阶段 ,就 应 该 选择 和 确定 配置 管理 的 规程 和 相应 的 工具 ,将 其 文档 化 并 
在 以 后 的 阶段 予以 实施 。 

软件 开发 过 程 中 ,需求 变更 是 经 常 发 生 的 。 随 着 对 软件 产品 的 理解 的 不 断 深 
入 ,需要 对 工作 产品 进行 修改 或 者 更 新 。 开 发 过 程 中 的 修改 和 变更 ,都 会 对 测试 工 
作 产 品 产 生 影 响 , 例 如 不 同 的 人 对 同一 个 文档 进行 修改 ,如 何 控制 文档 版 本 是 一 个 需要 
考虑 的 问题 。 
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测试 团队 往往 都 是 协同 工作 ,共同 完成 一 些 文档 ,例如 测试 用 例 的 设计 和 编写 ， 
如 果 没 有 配置 管理 中 的 访问 控制 的 保障 .往往 会 相互 覆盖 对 方 的 工作 内 容 而 造成 重 
大 损失 。 

在 测试 过 程 中 , 当 发 现 一 个 缺陷 时 ,应 该 记录 用 哪个 测试 用 例 发 现 这 个 缺陷 .此 测 
试用 例 所 参考 的 文档 和 标准 、 被 测 对 象 的 版 本 发现 这 个 缺陷 的 测试 环境 (操作 系统 、 
补丁 工具、 其 他 软件 以 及 硬件 架构 等 ) 等 。 如 果 是 自动 执行 测试 , 则 还 要 记录 测试 脚 
本 。 而 这 些 又 都 在 动态 地 变化 着 ,文档 和 被 测 对 象 的 版 本 也 在 不 断 更 新 , 随 着 测试 项 目 
规模 和 复杂 度 的 不 断 增 大 ,测试 过 程 如 果 没 有 很 好 的 配置 管理 的 支持 ,要 保持 它们 之 间 
的 关联 性 和 可 追溯 性 ,几乎 是 不 可 能 的 。 现 在 很 多 的 测试 管理 工具 都 提供 配置 管理 的 
功能 。 

配置 管理 是 项 目 管理 的 重要 组 成 部 分 。 测 试 团 队 应 该 利用 配置 管理 控制 测试 过 程 
中 的 变更 ,保持 它们 的 关联 性 和 可 追溯 性 ,确保 工作 产品 的 完整 性 。 


6.5 风险 和 测试 


风险 可 以 定义 为 事件 .危险 、 威 胁 或 情况 等 发 生 的 可 能 性 以 及 巾 此 产生 的 不 可 预料 
的 后 果 , 即 一 个 潜在 的 问题 。 风 险 级 别 取 决 于 发 生 不 确定 事件 的 可 能 性 和 产生 影响 的 程 
度 ( 事 件 引 发 的 不 良 后 果 ) 。 

测试 主要 关注 两 方面 的 风险 , 即 项 目 风险 和 产品 风险 。 前 者 与 测试 项 目 密切 相关 ， 
重点 关注 那些 会 影响 到 测试 项 目 按时 按 质 完成 的 风险 ,而 后 者 与 被 测 的 软件 组 件 或 系统 
密切 相关 ,主要 关注 组 件 或 系统 的 哪些 区 域 会 有 质量 问题 。 


5.5.1 项 目 风 险 


项 目 风险 是 围绕 项 目 按 目标 交付 的 能 力 的 一 系列 风险 ,影响 项 目 风险 的 因素 主要 有 
如 下 几 个 。 

(1) 组 织 因素 : 

QO@ 组 织 内 人 员 的 技能 、 组 织 对 培训 的 重视 程度 和 组 织 内 人 员 的 不 足 都 会 影响 到 项 目 
的 进展 和 质量 。 

@ 组 织 内 的 个 人 问题 同样 会 对 项 目 按时 按 质 的 完成 造成 影响 。 

G 组 织 的 政策 因素 ,例如 与 测试 人 员 进 行 需 求 和 测试 结果 沟通 方面 存在 的 问题 、 测 
试 和 评审 中 发 现 的 信息 未 能 得 到 进一步 跟踪 (如 未 改进 开发 和 测试 实践 ) 。 

@ 对 测试 的 态度 或 预期 不 合理 (例如 没有 意识 到 在 测试 中 发 现 缺 陷 的 价值 ) 。 

(2) 技术 因素 : 

QO@ 不 能 定义 正确 的 需求 ,使 得 需求 文档 的 质量 低下 ,无 法 实现 高 质量 的 测试 。 
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@ 给 定 现 有 限制 的 情况 下 , 没 能 满足 需求 的 程度 。 

Q 测试 环境 没有 及 时 准备 好 。 

@ 数据 转换 .迁移 计划 ,开发 和 测试 数据 转换 /迁移 工具 造成 的 延迟 。 

Q@ 低 质量 的 设计 、 编 码 .配置 数据 测试 数据 和 测试 。 

(3) 供应 商 因素 : 

Q@ 第 三 方 存在 的 问题 。 

@ 合同 方面 的 问题 。 

在 分 析 、 管 理 和 缓解 这 些 风 险 时 ,测试 经 理 需 要 遵循 完善 的 项 目 管理 原则 。《 软 件 测 
试 文档 标准 》(IEEE Std 829 一 1998) 中 指出 ,测试 计划 需要 陈述 风险 以 及 制定 相应 的 应 急 
措施 。 


5.5.2 产品 风险 


在 软件 或 系统 中 的 潜在 失效 部 分 (即将 来 可 能 发 生 不 利 事件 或 危险 的 部 分 ) 称 为 产 
品 风险 ,因为 它们 对 产品 质量 而 言 是 一 个 风险 ,包括 : 

(1) 故障 频 发 的 软件 产品 或 软件 系统 交付 使 用 。 

(2) 软件 /硬件 对 个 人 或 公司 造成 潜在 损害 的 可 能 性 。 

(3) 劣质 的 软件 特性 (例如 功能 性 、 可 靠 性 、 易 用 性 和 性 能 等 )。 

(4) 低劣 的 数据 完整 性 和 质量 (例如 数据 迁移 问题 .数据 转换 问题 .数据 传输 问题 . 违 
反 数 据 标准 问题 ) 。 

(5) 软件 没有 实现 既定 的 功能 。 

产品 风险 通常 可 以 用 来 决定 从 什么 地 方 开始 测试 (制定 优先 级 ) ,什么 地 方 需要 更 多 
的 测试 。 测 试 可 以 用 来 降低 产品 风险 或 可 以 减少 负面 事件 的 影响 。 

在 项 目 初 期 ,使 用 基于 风险 的 方法 进行 测试 ,有 利于 降低 产品 风险 的 级 别 。 它 包括 
对 产品 风险 的 识别 ,以 及 将 这 些 风险 应 用 到 指导 测试 计划 和 控制 .编写 各 种 测试 说 明 、 测 
试 准备 和 执行 中 。 在 基于 风险 的 测试 方法 中 ,识别 出 的 风险 可 以 用 于 : 

(1) 决定 采用 的 测试 技术 。 

(2) 确定 要 进行 测试 的 范围 。 

(3) 制定 测试 的 优先 级 ,尝试 尽早 地 发 现 严重 缺陷 。 

(4) 核定 是 否 可 以 通过 一 些 非 测 试 的 活动 来 降低 风险 (例如 对 缺乏 经 验 的 设计 者 进 
行 相应 的 培训 ) 。 

基于 风险 的 测试 需要 借助 于 项 目 利益 相关 者 的 集体 知识 和 智慧 ,从 而 识别 风险 以 及 
为 了 应 对 这 些 风险 需要 采用 的 测试 活动 。 

为 了 确保 产品 失效 的 可 能 性 和 影响 最 小 化 , 风险 管理 活动 提供 了 一 些 系 统 化 的 
方法 : 

(1) 评估 (并 定期 重新 评估 ) 可 能 出 现 的 错误 (风险 )。 
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(2) 决定 哪些 风险 是 重要 的 、 需 要 处 理 的 。 

(3) 处 理 风险 的 具体 措施 。 

风险 管理 是 一 个 系统 化 的 过 程 ,主要 包括 以 下 活动 。 

(1) 风险 识别 : 持续 识别 可 能 出 现 的 风险 ,识别 风险 是 风险 管理 活动 的 基础 ,有 多 种 
识别 风险 的 方法 ,如 基于 经 验 的 风险 评估 法 、 基 于 头脑 风暴 的 风险 评估 法 等 。 风 险 识别 
的 目的 是 尽早 并 持续 发 现 风 险 。 

(2) 风险 分 析 : 主要 是 对 已 经 识别 的 风险 进行 分 析 和 分 类 ,并 确定 风险 的 优先 级 , 即 
哪些 风险 是 重要 的 和 需要 优先 处 理 的 。 可 以 采用 不 同 的 分 类 方法 ,如 按 风险 影响 的 时 间 
可 分 为 短期 .中 期 和 长 期 风险 ; 也 可 按 风险 的 可 能 性 大 小 进行 分 类 。 对 风险 划分 优先 级 
的 方法 也 有 定量 分 析 法 和 定性 分 析 法 ,主要 对 风险 的 可 能 性 以 及 发 生 后 造成 的 损失 程度 
进行 分 析 后 ,确定 风险 的 优先 级 。 

(3) 风险 缓解 和 消除 : 在 风险 识别 和 风险 分 析 的 基础 上 ,考虑 处 理 风险 的 具体 措施 。 
首先 要 找到 风险 的 源头 ,采取 相应 措施 从 根本 上 消除 风险 。 但 是 在 实际 中 很 难 消 除 所 有 
的 风险 ,需要 根据 风险 的 不 同 优先 级 制定 不 同 的 风险 缓解 和 应 急 措施 。 尤 其 是 对 高 优先 
级 的 风险 不 仅 要 制定 缓解 策略 ,还 要 制定 详细 的 应 急 措施 ,而 对 低 优先 级 的 风险 可 能 只 
需 制 定 缓解 策略 和 粗略 的 应 急 措 施 。 

另外 ,测试 可 以 帮助 识别 新 的 风险 ,例如 ,通过 测试 ,发 现在 软件 系统 的 某 个 区 域内 
有 很 多 缺陷 ,这 个 区 域 就 是 个 新 的 风险 。 测 试 过 程 中 发 现 缺 陷 并 修改 缺陷 ,就 是 减低 了 
系统 的 风险 。 通 过 测试 还 可 以 降低 风险 的 不 确定 性 。 例 如 ,原先 认为 系统 的 某 个 功能 因 
采用 新 技术 而 存在 风险 ,但 通过 测试 评估 后 发 现 此 功能 模块 的 质量 很 好 ,这 就 解除 了 风 
险 的 不 确定 性 。 测 试 还 为 风险 分 析 提 供 反馈 ,使 得 对 风险 的 预测 更 为 准确 ,以 及 通过 测 
试 能 对 风险 缓解 措施 的 有 效 性 进行 评估 。 

在 测试 的 计划 阶段 就 应 该 开始 对 风险 进行 管理 ,并 且 把 风险 管理 计划 作为 测试 计划 
内 容 的 重要 部 分 。 测 试 风险 管理 对 风险 进行 识别 ,分 析 并 根据 风险 的 可 能 性 和 影响 程度 
对 风险 划分 优先 级 ,然后 根据 优先 级 制定 风险 的 缓解 措施 和 应 急 措施 。 测 试 风险 管理 由 
测试 经 理 负责 ,需要 测试 团队 中 所 有 成 员 的 积极 参与 ,同时 也 需要 从 测试 团队 外 部 的 人 
员 中 得 到 一 些 风 险 的 信息 和 反馈 (例如 项 目 开发 人 员 、 软 件 质量 保证 人 员 等 ) 。 

风险 管理 有 如 下 几 个 特点 。 

(1) 风险 管理 应 该 是 系统 化 的 过 程 : 从 风险 识别 到 风险 应 对 ,风险 管理 是 控制 所 有 
可 能 对 测试 造成 影响 的 因素 的 过 程 。 

(2) 风险 管理 应 该 是 个 主动 的 过 程 : 测试 风险 管理 的 目的 是 尽量 减少 对 测试 目的 不 
利 事件 发 生 的 可 能 性 和 影响 程度 。 因 此 , 它 是 一 种 积极 预防 的 过 程 , 即 主动 的 过 程 。 

(3) 风险 管理 应 该 是 个 持续 的 过 程 : 测试 风险 管理 是 一 个 持续 的 过 程 ,应 该 贯穿 于 
整个 测试 过 程 。 
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6.6 事件 管理 


事件 是 指 测试 过 程 中 出 现 的 、 非 正常 的 ,并 在 此 后 的 测试 过 程 中 还 要 加 以 关注 的 任 
何事 情 。 测 试 过 程 中 发 现 的 缺陷 或 失效 都 属于 事件 。 本 节 主 要 关注 事件 中 的 缺陷 ,事件 
管理 的 重点 也 在 缺陷 管理 上 。 

尽早 发 现 缺陷 能 有 效 降低 修改 缺陷 的 费用 ,尽早 发 现 缺 陷 也 是 软件 测试 的 一 个 重要 
目的 。 测 试 过 程 中 发 现实 际 结果 和 预期 结果 之 间 存 在 的 差异 ,需要 作为 事件 被 记录 。 若 
经 过 调查 发 现 该 事件 是 一 个 缺陷 , 则 需 提 交 缺 陷 报告 ,要 求 开 发 人 员 进 行 缺 陷 定 位 和 修 
复 。 在 软件 产品 的 开发 评审、 测试 和 使 用 的 过 程 中 都 会 发 现 缺陷 。 软 件 开发 过 程 中 的 
各 类 工作 产品 都 可 能 存在 缺陷 ,例如 概要 设计 说 明 、 详 细 设 计 说 明 测试 计划 、 测 试用 例 、 
代码 ,帮助 或 安装 手册 等 。 

缺陷 从 被 发 现 \ 被 提交 (缺陷 报告 ) 、 进 行 分 析 、 被 修改 、 对 修改 的 确认 (确认 测试 ), 直 
到 最 终 缺 陷 被 关闭 形成 了 缺陷 从 诞生 到 结束 的 生命 周期 ,在 整个 缺陷 生命 周期 内 需要 对 
缺陷 进行 有 效 的 跟踪 和 管理 。 为 了 保证 能 够 监控 所 有 的 缺陷 ,组 织 内 需要 建立 一 套 完 整 
的 过 程 和 规则 。 

测试 经 理 和 测试 人 员 都 需要 了 解 和 掌握 缺陷 管理 的 过 程 ,两 者 在 缺陷 管理 过 程 中 的 
职责 和 关注 点 会 不 一 样 。 测 试 经 理 主要 关注 缺陷 管理 过 程 中 的 识别 .跟踪 和 移 除 缺 陷 的 
方法 。 而 测试 人 员 主 要 关注 如 何在 测试 过 程 中 正确 发 现 和 记录 缺陷 ,并 对 缺陷 进行 确认 
测试 (再 测试 ) 和 相关 的 回归 测试 。 

对 缺陷 的 有 效 管理 对 评估 和 改进 产品 质量 、 测 试 过 程 、 开 发 过 程 等 都 有 重要 意义 。 
在 缺陷 管理 过 程 中 起 着 关键 作用 的 是 缺陷 报告 ,缺陷 报告 的 主要 目的 和 作用 有 : 

(1) 为 开发 人 员 和 其 他 人 员 提 供 问题 反馈 ,在 需要 的 时 候 可 以 鉴别 、 隔 离 和 纠正 这 些 
缺陷 。 

(2) 为 测试 经 理 提供 被 测试 系统 的 质量 信息 ,并 作为 调整 测试 进度 的 依据 。 

(3) 为 测试 过 程 改进 提供 第 一 手 资料 。 


5.6.1 缺陷 状态 和 相关 角色 


缺陷 从 被 发 现 开始 到 最 终 解决 之 间 可 能 处 于 多 个 不 同 的 状态 。 同 时 ,各 个 缺陷 状态 
需要 有 不 同 角色 的 人 员 进 行 操作 和 处 理 , 各 个 角色 的 职责 也 不 一 样 。 下 面 通过 一 个 案例 
阐述 缺陷 生命 周期 中 的 主要 状态 和 角色 。 

本 节 介 绍 一 个 根据 IEEE Std 1044 一 1993 制定 的 缺陷 生命 周期 案例 ,如 图 5-8 所 示 。 

图 5-8 是 某 项 目的 缺陷 生命 周期 中 的 缺陷 状态 转换 图 。 下 面 分 别 阐述 缺陷 生命 周期 
中 的 缺陷 状态 、 相 关 人 员 角 色 、 缺 陷 的 严重 程度 和 处 理 缺 陷 的 优先 级 。 
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图 5-8 缺陷 状态 转换 图 


1. 相关 角色 


(1) 测试 人 员 : 主要 是 指 发 现 和 报告 缺陷 的 测试 人 员 。 通 常情 况 下 ,测试 人 员 需 要 
对 该 缺陷 后 续 相关 的 状态 负责 ,包括 回答 相关 人 员 对 这 个 缺陷 信息 的 询问 ,以 及 在 正式 
版 本 上 进行 确认 测试 (再 测试 ) 和 回归 测试 。 

(2) 开发 人 员 : 主要 指 对 缺陷 进行 研究 和 修复 的 开发 人 员 。 开 发 人 员 将 修复 后 的 缺 
陷 提 交 测 试 人 员 正 式 确认 测试 (再 测试 ) 之 前 ,需要 对 修改 后 的 缺陷 在 开发 环境 上 进行 

(3) 缺陷 评审 委员 会 : 主要 由 项 目 经 理 、 测 试 经 理 、 质 量 经 理 、 开 发 经 理 以 及 资深 的 
开发 人 员 ,测试 人 员 等 组 成 。 他 们 对 缺陷 进行 确认 ,并 将 其 分 配给 相应 的 开发 人 员 进 行 
修复 ,同时 对 有 争议 的 缺陷 进行 仲裁 。 

(4) 版 本 经 理 : 负责 将 已 经 解决 的 缺陷 相关 的 配置 信息 合并 到 新 的 版 本 。 


2. 缺陷 状态 


(1) 新 缺陷 (New) : 软件 中 新 发 现 的 缺陷 通常 由 测试 人 员 提 交 。 当 然 也 可 能 由 开发 
人 员 自 己 在 组 件 测试 或 代码 走读 过 程 中 提交 ,还 有 可 能 是 从 软件 使 用 的 最 终 用 户 或 使 用 
现场 反馈 得 到 的 缺陷 报告 。 具 体 可 能 发 现 缺陷 的 阶段 有 : 

@ 需求 和 设计 阶段 : 文档 评审 过 程 中 发 现 的 缺陷 。 
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@ 编码 阶段 : 代码 评审 和 代码 静态 分 析 过 程 中 发 现 的 缺陷 。 

@ 测试 阶段 : 动态 测试 过 程 中 发 现 的 缺陷 。 

@ 使 用 阶段 : 用 户 反馈 的 缺陷 。 

(2) 接受 (Accepted) : 相关 人 员 提 交 的 缺陷 报告 ,需要 经 过 缺陷 评审 委员 会 的 评审 。 
缺陷 报告 评审 通过 后 ,将 缺陷 状态 置 为 接受 。 缺 陷 评审 委员 会 评审 的 主要 内 容 包括 : 

@ 缺陷 报告 中 描述 的 问题 是 否 确实 是 一 个 缺陷 。 

@ 提交 的 缺陷 报告 是 否 符合 要 求 。 

(3) 分 配 (Assign): 缺陷 评审 委员 会 将 缺陷 状态 为 "接受 ”的 缺陷 分 配给 相关 人 员 进 
行 问题 定位 和 修复 ,相应 的 缺陷 状态 被 置 为 "分配 ”。 

(4) 打开 (Open): 当 缺 陷 处 于 “打开 ?状态 时 ,说 明 开 发 人 员 已 经 开始 对 该 缺陷 进行 
修复 。 

(5) 交付 (Deliver) : 解决 缺陷 的 方法 已 经 找到 ,并 且 已 经 将 修改 后 的 代码 等 打上 标 
签 ,交付 给 版 本 经 理 。 

(6) 解决 (Resolved) : 版 本 经 理 将 相关 的 标签 等 合 入 某 个 版 本 ,交付 给 相关 的 开发 
小 组 进行 验证 , 若 测试 通过 , 则 缺陷 状态 置 为 "解决 ”。 

(7) 已 修复 (Fixed): 版 本 经 理 将 已 经 解决 的 缺陷 标签 合 人 某 个 版 本 ,交付 给 相关 的 
测试 小 组 进行 确认 测试 ,测试 通过 , 则 缺陷 状态 为 “已 修复 ”。 

(8) 关闭 (Closed) : 缺陷 状态 处 于 “已 修复 ”后 ,缺陷 评审 委员 会 对 整个 缺陷 修复 过 
程 进行 评审 ,评审 通过 后 将 缺陷 状态 修改 为 “关闭 ”状态 。 

上 面 介绍 的 缺陷 状态 是 缺陷 管理 过 程 中 主要 的 状态 ,或 者 是 缺陷 处 理 顺 利 时 所 经 历 
的 状态 。 实 际 上 ,缺陷 管理 过 程 中 还 可 能 有 一 些 其 他 的 状态 ,分 别 是 : 

(1) 研究 (Investigate): 当 缺 陷 分 配给 开发 人 员 时 ,开发 人 员 并 不 是 都 能 直接 找到 相 
关 的 解决 方案 。 开 发 人 员 需 要 对 缺陷 和 引起 缺陷 的 原因 进行 调查 研究 ,这 时 候 可 以 将 缺 
陷 状 态 置 为 “研究 ”状态 。 

(2) 询问 和 回答 (Query&Reply) : 若 负责 缺陷 修复 的 开发 人 员 认 为 缺陷 描述 的 信息 
不 够 明确 ,或 希望 得 到 更 多 与 缺陷 相关 的 配置 和 环境 条 件 等 ,可 以 将 缺陷 状态 置 为 “询问 
和 回答 ”。 

(3) 拒绝 (Declined) : 缺陷 评审 委员 会 通过 讨论 研究 ,认为 提交 的 问题 不 是 缺陷 ; 或 
通过 开发 人 员 的 研究 分 析 , 认 为 其 不 是 缺陷 ,开发 人 员 可 以 将 具体 的 理由 加 入 到 缺陷 描 
述 中 ,缺陷 评审 委员 会 据 此 将 缺陷 状态 修改 为 “拒绝 ”。 

(4) 重复 (Duplicated) : 缺陷 评审 委员 会 认为 该 缺陷 和 某 个 已 经 提交 的 缺陷 描述 的 
是 同一 个 问题 ,可 以 将 该 缺陷 状态 置 为 “重复 ”。 

(5) 延期 (Deferred) : 缺陷 不 在 当前 版 本 解决 。 

(6) 无 计划 (CUnplanned) : 在 用 户 需求 中 没有 要 求 或 计划 。 


3. 严重 程度 
缺陷 的 严重 程度 指 的 是 若 缺 陷 没有 修复 ,软件 缺陷 对 软件 质量 的 破坏 程度 , 即 此 软 
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件 缺 陷 的 存在 对 软件 功能 特性 和 非 功能 特性 产生 的 影响 。 缺 陷 的 严重 程度 关注 的 是 缺 
陷 引发 的 问题 对 客户 的 影响 程度 。 在 给 缺陷 确定 严重 程度 时 ,应 该 从 软件 最 终 用 户 的 角 
度 进行 判断 , 即 根据 缺陷 会 对 用 户 使 用 造成 的 影响 程度 来 确定 。 软 件 缺 陷 的 严重 程度 和 
缺陷 发 生 的 可 能 性 没有 直接 的 关系 。 一 般 而 言 ,缺陷 的 影响 越 大 ,缺陷 的 严重 程度 越 高 。 
下 面 是 一 个 划分 缺陷 严重 程度 的 例子 ,在 此 例子 中 ,缺陷 严重 程度 被 分 为 4 个 等 级 。 

(1) 严重 程度 1( 致 命 的 )。 产 品 在 正常 的 运行 环境 下 无 法 给 用 户 提供 服务 ,并 且 没 
有 其 他 的 工作 方式 可 以 补救 ; 或 者 软件 失效 会 造成 人 身 伤害 或 危及 人 身 安全 ,例如 : 

Q@ 问题 会 自发 地 影响 系统 的 数据 传输 。 

@ 用 户 使 用 正常 的 操作 步骤 ,就 会 影响 系统 提供 的 服务 。 

@ 软件 的 操作 系统 崩溃 ,造成 数据 的 丢失 。 

@ 无 法 提供 系统 的 主要 功能 。 

@ 可 能 会 造成 人 身 伤 害 。 

(2) 严重 程度 2( 严 重 的 )。 极 大 地 影响 系统 提供 给 用 户 的 服务 ,或 者 严重 影响 系统 
要 求 或 者 基本 功能 的 实现 ,例如 : 

Q@ 系统 中 的 部 分 组 件 会 自动 重启 ,但 没有 影响 系统 所 提供 的 传输 性 能 。 

@ 用 户 使 用 正常 的 操作 会 导致 系统 重启 或 挂 起 ,但 不 影响 系统 的 数据 传输 。 

@ 软件 的 某 个 子 菜单 不 起 作用 ,或 者 会 产生 错误 的 结果 。 

(3) 严重 程度 3( 一 般 的 ) 。 系 统 功能 需要 增强 或 存在 缺陷 ,但 有 相应 的 补救 方法 解 
决 这 个 缺陷 ,例如 : 

@ 系统 的 某 个 功能 失效 ,但 系统 没有 提供 相应 的 警告 。 

@ 功能 特征 设计 不 符合 系统 的 需求 ,不 影响 系统 的 业务 ,并 且 有 相应 的 补救 方法 。 

@ 本 地 化 软件 的 某 些 字符 没有 翻译 或 者 翻译 错误 。 

(4) 严重 程度 4( 轻 微 的 )。 细 小 的 问题 ,不 需要 补救 方法 或 对 功能 进行 增强 ; 或 者 操 
作 不 方便 ,容易 使 用 户 误 操作 ,例如 : 

QH 上 报 的 信息 不 符合 系统 的 需求 ,描述 不 精确 或 可 能 对 用 户 有 些 误 导 。 

@ GUI 界面 问题 ,不 精确 或 可 能 产生 歧义 。 


4. 优先 级 


优先 级 是 处 理 软件 缺陷 的 先后 顺序 的 指标 。 确 定 缺 陷 的 优先 级 更 多 的 是 站 在 软件 
开发 和 软件 测试 的 角度 进行 考虑 。 确 定 缺 陷 的 优先 级 有 时 候 可 能 并 不 是 纯 技 术 的 问题 ， 
还 需要 考虑 修复 缺陷 的 难度 和 存在 的 风险 。 因 此 ,缺陷 优先 级 的 确定 是 一 个 复杂 的 过 
程 。 优 先 级 的 确定 也 需要 考虑 缺陷 发 生 的 频率 和 对 目标 用 户 的 影响 。 下 面 是 一 个 划分 
缺陷 优先 级 的 例子 ,在 这 个 例子 中 对 缺陷 的 优先 级 划分 为 4 个 等 级 : 

(1) 优先 级 1( 立 即 修改 ): 由 于 该 缺陷 的 存在 ,导致 开发 活动 或 测试 活动 无 法 继续 。 
该 问题 需要 立即 修复 ,或 必要 的 话 采取 临时 措施 (如 打 补丁 的 方式 ) 。 

(2) 优先 级 2( 下 次 发 布 前 修改 ): 在 下 次 常规 的 产品 发 布 或 下 次 (内 部 ) 测 试 对 象 版 
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本 交付 前 实施 修正 。 

(3) 优先 级 3( 必 要 时 修改 ) : 在 受 影响 的 系统 部 件 进行 修订 时 进行 修正 。 

(4) 优先 级 4( 未 决 ): 尚 无 修正 计划 。 

缺陷 的 严重 程度 和 优先 级 是 含义 不 同 但 相互 联系 密切 的 两 个 概念 ,它们 从 不 同方 面 
描述 了 软件 缺陷 对 软件 质量 、 用 户 、 开 发 过 程 的 影响 程度 和 处 理 方式 。 一 般 来 说 ,严重 程 
度 高 的 缺陷 具有 较 高 的 优先 级 。 严 重 程度 高 说 明 缺陷 对 软件 造成 的 质量 危害 性 大 ,需要 
优先 处 理 , 而 严重 程度 低 的 缺陷 可 能 只 是 软件 的 瑕 症 , 可 以 稍 后 处 理 。 但 是 优先 级 和 严 
重 程度 并 不 总 是 一 一 对 应 的 ,也 存在 优先 级 低 但 严重 程度 高 的 缺陷 ,或 者 优先 级 高 但 严 
重 程度 低 的 软件 缺陷 。 

修改 软件 缺陷 并 不 是 纯 技术 的 问题 ,有 时 候 需 要 考虑 软件 版 本 发 布 和 质量 风险 等 因 
素 。 下 面 是 关于 缺陷 严重 程度 和 优先 级 设置 方面 的 一 些 建议 。 

(1) 如 果 某 个 严重 的 缺陷 只 在 非常 极端 的 条 件 下 才 会 出 现 , 则 可 以 将 缺陷 的 优先 级 
设置 得 比较 低 。 

(2) 如 果 修正 一 个 软件 缺陷 需要 重新 修改 软件 的 整体 架构 ,可 能 会 产生 更 多 的 潜在 
缺陷 ,而 且 市 场 要 求 尽快 发 布 软件 版 本 ,那么 即使 这 个 缺陷 严重 程度 很 高 ,也 需要 仔细 考 
虑 是 否 需 要 修改 。 

(3) 对 于 有 些 缺 陷 , 可 能 它 的 严重 程度 很 低 , 例 如 界面 单词 拼写 错误 ,但 假如 这 是 公 
司 的 名 称 或 者 商标 , 则 这 个 缺陷 的 优先 级 就 很 高 ,必须 尽快 进行 修复 ,因为 这 关系 到 软件 
系统 和 公司 在 市 场 上 的 形象 。 

正确 区 分 和 处 理 缺 陷 严 重 程度 和 优先 级 ,是 软件 质量 保证 的 重要 环节 。 因 此 ,正确 
处 理 和 区 分 缺陷 的 严重 程度 和 低 优 先 级 是 所 有 的 软件 开发 和 测试 相关 人 员 的 重要 职责 ， 
需要 正确 理解 缺陷 严重 程度 和 优先 级 的 含义 ,同时 认识 到 这 是 保证 软件 质量 的 重要 环 
节 , 应 该 引起 足够 的 重视 。 将 比较 轻微 的 缺陷 设置 成 高 严重 程度 和 高 优先 级 的 缺陷 , 硅 
大 缺陷 的 严重 程度 ,将 影响 软件 质量 的 正确 评估 ,耗费 开发 人 员 辨 别 和 处 理 缺 陷 的 时 间 ; 
而 将 严重 的 缺陷 报告 成 低 严 重 程度 和 低 优先 级 的 缺陷 ,这 样 会 掩盖 许多 严重 的 缺陷 。 如 
果 在 项 目 或 者 软件 发 布 前 ,发现 还 有 很 多 由 于 不 正确 分 配 优先 级 造成 的 严重 缺陷 ,将 需 
要 投入 很 多 人 力 和 时 间 进 行 修改 ,影响 软件 的 正常 发 布 ; 或 者 严重 的 缺陷 成 为 漏网 之 鱼 ， 
随 着 软件 一 起 发 布 出 去 ,就 会 影响 软件 的 质量 、 降 低 用 户 使 用 软件 的 信心 。 


5.6.2 缺陷 报告 和 跟踪 


缺陷 管理 生命 周期 由 缺陷 识别 、 缺 陷 调 查 、 缺 陷 改 正和 缺陷 总 结 4 个 阶段 组 成 。 对 
于 每 个 阶段 ,分 别 由 记录 、 分 类 和 确定 影响 三 个 活动 组 成 ,这 三 个 活动 的 对 象 是 缺陷 报告 
的 组 成 要 素 。 不 同 的 组 织 或 项 目 .可 以 将 IEEE Std 1044 一 1993 中 定义 的 要 素 映 射 到 相 
应 的 缺陷 报告 模板 中 ,并 且 根 据 需要 将 缺陷 相关 的 要 素 名 称 进 行 修改 。 同 时 ,也 可 以 根 
据 需 要 对 缺陷 报告 的 组 成 进行 裁减 。 
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下 面 将 从 缺陷 报告 的 组 成 ,缺陷 报告 的 编写 和 缺陷 报告 的 跟踪 三 个 方面 对 相关 内 容 
进行 解释 。 


1. 缺陷 报告 的 组 成 


缺陷 描述 形成 的 文档 就 是 缺陷 报告 , 它 描述 了 与 每 个 缺陷 相关 的 各 种 信息 。 缺 陷 跟 
踪 是 记录 测试 过 程 中 每 个 缺陷 从 发 现 到 关闭 的 一 系列 状态 的 活动 。 

在 软件 生命 周期 中 发 现 的 缺陷 ,都 建议 以 文档 的 形式 , 即 缺 陷 报告 的 形式 进行 提交 。 
有 了 缺陷 报告 和 相应 的 缺陷 管理 过 程 的 支持 ,才能 进行 有 效 的 管理 和 跟踪 缺陷 ,并 为 过 
程控 制 和 过 程 改进 提供 必要 的 信息 和 数据 。 

根据 不 同 组 织 的 质量 方针 和 测试 策略 ,缺陷 报告 的 组 成 会 有 所 不 同 。 但 缺陷 报告 的 
基本 框架 结构 可 以 参考 IEEE Std 829 一 1998 中 建议 的 模板 。 以 下 是 缺陷 报告 的 主要 组 
成 内 容 。 

(1) 缺陷 标识 : 唯一 标识 缺陷 的 标识 符 ,缺陷 标识 在 整个 缺陷 管理 系统 中 应 该 是 唯 
一 的 。 
(2) 所 属 产品 : 缺陷 所 属 的 产品 或 项 目 。 

(3) 摘要 : 对 缺陷 进行 简短 而 清晰 的 描述 ,使 缺陷 相关 人 员 可 以 快速 了 解 缺 陷 的 
内 容 。 

(4) 测试 环境 : 包括 发 现 缺陷 的 测试 平台 、 操 作 系统 ,测试 软件 版 本 、 系 统 配置 等 。 

(5) 发 现 日 期 和 时 间 : 缺陷 发 现 的 日 期 和 时 间 。 

(6) 缺陷 提交 者 : 缺陷 报告 的 提交 者 ,可 以 是 开发 人 员 测试 人 员 .用 户 等。 同时 ,这 
里 也 可 以 提供 缺陷 提交 者 的 电子 邮件 地 址 ,这 样 缺陷 管理 工具 可 以 在 缺陷 状态 发 生变 更 
的 时 候 , 直 接 将 状态 信息 发 送 给 缺陷 提交 人 。 

(7) 缺陷 的 优先 级 : 可 以 是 立即 修改 、 下 次 发 布 前 修改 、 必 要 时 才 修 改 、 或 可 修改 可 
不 修改 等 。 

(8) 缺陷 的 严重 程度 : 缺陷 造成 的 影响 可 以 是 致命 的 ,严重 的 一般 的 或 轻微 的 等 。 

(9) 缺陷 发 现 阶 段 : 缺陷 在 软件 开发 生命 周期 的 哪个 阶段 被 发 现 ,可 以 是 需求 阶段 、 
设计 阶段 .编码 阶段 测试 阶段 .实际 用 户 使 用 阶段 等 。 

(10) 缺陷 复 现 步 又: 包括 发 现 缺 陷 的 输入 、 测 试 步骤 、 期 望 的 输出 ,实际 的 输出 以 及 
存在 的 异常 情况 等 。 

(11) 缺陷 其 他 信息 : 发 现 缺 陷 的 测试 用 例 编号 ,和 缺陷 相关 的 一 些 日 志文 件 、 警 告 
信息 和 打印 信息 等 。 


2. 缺陷 报告 的 编写 


了 解 缺 陷 报告 的 主要 内 容 后 ,需要 考虑 如 何 编写 缺陷 报告 。 缺 陷 报告 是 测试 人 员 在 
测试 过 程 中 的 重要 工作 之 一 ,编写 良好 的 缺陷 报告 也 是 提高 软件 质量 的 重要 保障 。 有 效 
的 缺陷 报告 ,对 测试 团队 而 言 具 有 重要 的 意义 ,主要 表现 在 : 
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(1) 可 以 减少 被 开发 人 员 拒 绝 的 缺陷 数量 。 

(2) 加 快 缺陷 修改 的 速度 。 

(3) 增加 测试 人 员 测 试 能 力 的 可 信和 度 。 

(4) 改善 开发 人 员 和 测试 人 员 之 间 的 团队 合作 。 

(5) 更 加 高 效 地 提高 软件 质量 。 

编写 有 效 的 缺陷 报告 对 测试 过 程 和 软件 质量 很 重要 ,一 个 好 的 缺陷 报告 应 该 考虑 到 
如 下 几 点 。 

(1) 精简 : 缺陷 的 描述 应 该 是 清晰 而 简要 的 。 首 先 在 缺陷 报告 中 剔除 不 必要 的 内 容 
和 信息 。 缺 陷 报告 中 应 包含 所 有 缺陷 相关 的 信息 ,并 且 确 实 是 相关 的 。 多 余 的 信息 只 会 
使 缺陷 描述 含糊 不 清 。 

(2) 正确 : 确保 提交 的 问题 确实 是 一 个 缺陷 。 若 提交 的 缺陷 最 后 证 明 是 由 于 测试 人 
员 的 理解 错误 或 者 配置 错误 引起 的 ,久而久之 可 能 使 得 测试 人 员 在 开发 人 员 面 前 失去 可 
信和 度 ,同时 会 对 彼此 之 间 的 沟通 带 来 一 定 的 影响 。 当 然 ,不 能 因为 害怕 提交 错误 的 缺陷 
报告 ,就 对 可 能 出 现 的 缺陷 视而不见 ,这 比 提交 错误 的 缺陷 报告 的 影响 更 恶劣 。 因 此 ,在 
提交 缺陷 报告 之 前 ,请 考虑 以 下 几 个 问题 : 

@ 测试 环境 是 否 正 确 。 

@ 使 用 的 版 本 是 否 正确 。 

@ 前 面 测试 用 例 的 配置 信息 是 否 干扰 了 当前 测试 用 例 的 执行 。 

@ 网 络 通信 是否 正确 。 

@ 是 否 正确 理解 了 产品 的 工作 原理 。 

(3) 中 立 : 公正 地 表达 自己 的 观点 ,对 缺陷 及 其 特征 进行 实事 求 是 的 描述 ,避免 夸 
张 . 幽 默 .讽刺 的 态度 。 避 免 在 缺陷 报告 中 带 有 个 人 感情 色彩 ,因为 这 种 感情 色彩 可 能 会 
影响 团队 之 间 的 合作 和 沟通 。 

(4) 准确 : 准确 而 明白 地 描述 一 个 问题 ,而 不 是 仅仅 对 做 了 什么 进行 描述 ,还 应 该 对 
发 现 了 什么 进行 描述 。 

(5) 隔离 : 尽量 寻找 简短 的 步骤 来 复 现 缺 陷 , 即 将 缺陷 进行 隔离 。 例 如 是 在 哪个 模 
块 中 发 现 了 这 个 缺陷 ,是 哪个 输入 条 件 触发 了 这 个 缺陷 ,是 哪个 动作 引起 了 这 个 缺陷 等 。 
对 缺陷 的 隔离 定位 能 力 , 很 大 程度 上 可 以 提高 测试 人 员 的 可 信和 度 , 同 时 可 以 提高 测试 效 
率 和 项 目 整体 的 效率 。 

(6) 推广 : 确定 系统 其 他 部 分 是 否 也 存在 同样 的 问题 ,以 及 使 用 不 同 的 数据 时 是 否 
也 会 出 现 这 种 问题 等 。 测 试 人 员 在 缺陷 方面 的 推广 能 力 , 可 以 帮助 节约 开发 人 员 修正 缺 
陷 的 时 间 ,同时 提高 缺陷 修改 的 效率 。 

(7) 复 现 : 确定 系统 是 否 可 以 复 现 这 个 缺陷 ,需要 什么 样 的 输入 步骤 来 复 现 这 个 缺 
陷 。 对 于 能 够 复 现 的 缺陷 ,提供 简单 的 步骤 和 输入 。 对 于 难以 复 现 的 缺陷 ,尽量 提供 一 
些 系统 的 警告 信息 日志 信 息 给 开发 人 员 ,或 者 发 现 缺 陷 时 ,可 以 和 开发 人 员 一 起 进行 跟 
踪 调 试 和 定位 。 对 于 实在 无 法 复 现 的 问题 ,在 事件 报告 中 明确 说 明 , 并 且 在 后 续 测试 中 
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持续 跟踪 。 

(8) 证 据 : 如 同 写 测试 用 例 需 要 从 分 析 测 试 依据 到 确认 测试 条 件 一 样 ,在 缺陷 报告 
中 ,需要 提供 测试 的 期 望 值 和 实际 得 到 的 输出 值 ,测试 依 据 。 每 个 人 看 待 问 题 的 标准 是 
不 一 样 的 ,所 以 需要 在 同一 个 基础 上 工作 ,保证 文档 的 完备 性 。 

(9) 评审 : 至 少 有 一 个 同行 ,最 好 是 一 个 有 经 验 的 测试 人 员 或 者 测试 经 理 , 在 提交 缺 
陷 报告 之 前 阅读 一 遍 。 


3. 缺陷 报告 的 管理 


缺陷 管理 是 根据 缺陷 的 状态 来 管理 缺陷 的 整个 生命 周期 。 缺 陷 提交 的 目的 是 为 了 
修正 缺陷 ,因此 缺陷 管理 工作 的 一 个 重要 内 容 是 按照 缺陷 生命 周期 ,推动 相关 责任 人 进 
行 相关 的 缺陷 处 理 。 按 照 缺陷 的 严重 程度 和 优先 级 ,保证 缺陷 能 够 在 规定 的 时 间 内 得 到 
修复 和 验证 ,并 且 及 时 地 关闭 。 同 时 根据 缺陷 的 状态 和 期 望 修复 的 日 期 ,对 测试 工作 和 
测试 资源 进行 重新 计划 ,从 而 合理 安排 后 续 的 测试 任务 和 测试 活动 。 

缺陷 数据 收集 是 缺陷 管理 的 另 一 个 重要 工作 。 收 集 的 缺陷 数据 包括 缺陷 按 严 重 程 
度 .发 现 阶段 ,状态 等 的 分 布 情况 。 缺 陷 数 据 收集 的 目的 之 一 是 为 了 对 数据 进行 分 析 ,并 
且 用 于 缺陷 度量 。 缺 陷 数 据 分 析 是 基于 前 面 收集 的 缺陷 数据 。 缺 陷 分 析 的 目的 是 为 了 
生成 缺陷 相关 的 缺陷 度量 ,用 于 指导 和 改进 开发 和 测试 过 程 。 

缺陷 管理 工作 需要 有 合适 的 管理 理念 进行 支撑 。 尽 管 开 发 人 员 和 测试 人 员 共 同 的 
目标 是 提交 高 质量 的 软件 产品 ,但 测试 过 程 中 开发 人 员 和 测试 人 员 可 能 存在 潜在 的 对 立 
关系 。 管理 人 员 应 重视 缺陷 数据 的 正确 使 用 ,避免 造成 由 于 开发 人 员 和 测试 人 员 之 间 的 
对 立 ,影响 开发 效率 。 

缺陷 管理 过 程 中 ,开发 人 员 和 测试 人 员 之 间 建 立 相 互信 任 关 系 非常 重要 。 有 效 的 沟 
通 可 以 在 缺陷 管理 中 避免 项 目 利益 相关 者 之 间 的 相互 指责 ,支持 收集 和 解释 目标 信息 。 
缺陷 报告 的 准确 性 、 合 理 的 分 类 和 客观 的 表述 有 助 于 改善 缺陷 报告 提交 人 员 和 缺陷 修复 
人 员 之 间 的 关系 。 测 试 人 员 应 考虑 到 缺陷 的 重要 性 ,并 提供 可 用 的 客观 信息 。 下 面 是 一 
些 改善 缺陷 管理 的 建议 。 

(1) 缺陷 报告 不 针对 个 人 ,而 且 在 缺陷 中 不 要 摊 杂 个 人 感情 因素 ,而 应 该 采用 中 立 的 
缺陷 表述 。 

(2) 按照 缺陷 报告 编写 要 求 提交 缺陷 报告 ,尽量 利用 现成 的 缺陷 报告 模板 。 

(3) 如 果 开 发 人 员 对 缺陷 报告 存在 异议 ,那么 需要 仔细 考虑 他 们 的 意见 ,在 必要 的 时 
候 可 以 通过 缺陷 评审 委员 会 来 裁决 。 

缺陷 管理 过 程 中 ,测试 人 员 还 需要 注意 其 他 一 些 常见 的 问题 。 

(1) 是 否 是 缺陷 : 开发 人 员 和 测试 人 员 对 于 缺陷 的 认定 可 能 存在 不 同 的 意见 。 开 发 
人 员 认 为 是 正常 的 功能 ,而 测试 人 员 可 能 认为 是 一 个 缺陷 。 

(2) 缺陷 无 法 复 现 : 确实 存在 一 些 无 法 复 现 的 缺陷 ,特别 是 在 系统 测试 过 程 中 .有 些 
缺陷 的 复 现 可 能 需要 非常 复杂 的 操作 组 合 。 无 法 复 现 的 问题 还 包括 那些 虽然 没有 进行 
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任何 的 修复 工作 ,但 好 像 在 其 他 缺陷 修复 后 的 新 版 本 中 ,这 个 缺陷 自动 消失 了 。 如 果 缺 
陷 难 以 解决 ,那么 直到 确定 缺陷 消失 为 止 ,都 应 该 一 直 保持 缺陷 报告 有 效 。 

(3) 缺陷 优先 级 问题 : 缺陷 优先 级 的 量化 很 困难 。 当 缺陷 被 分 配 低 优 先 级 时 ,常规 
的 做 法 是 延迟 对 它 的 修复 。 所 带 来 的 风险 是 有 些 优 先 级 较 低 的 缺陷 对 产品 质量 或 者 测 
试 进度 带 来 的 影响 很 大 。 

(4) 其 他 问题 : 测试 人 员 报 告 的 缺陷 被 遗忘 ; 产品 发 布 后 ,遗留 缺陷 太 多 ,管理 人 员 
将 矛头 指向 测试 人 员 ; 编写 的 事件 报告 不 规范 ,使 得 开发 人 员 不 得 不 与 测试 人 员 面 谈 ; 
地 域 分 散 的 开发 团队 ,通过 E-mail 交流 缺陷 信息 ,缺陷 状态 混乱 ,相关 人 员 无 法 及 时 获得 
有 关 的 变更 信息 等 。 

对 于 在 管理 缺陷 过 程 中 出 现 的 这 些 问题 ,必须 要 以 保证 产品 质量 为 依据 寻找 解决 方 
案 , 对 于 有 争议 的 问题 ,由 缺陷 评审 委员 会 来 做 最 终 的 裁决 。 解 决 这 些 问 题 ,另外 一 个 有 
效 的 办 法 是 采用 缺陷 管理 跟踪 系统 。 通 过 缺陷 管理 跟踪 系统 ,相关 人 员 可 以 报告 .管理 
以 及 分 析 缺 陷 报告 .缺陷 分 布 和 缺陷 趋势 等 。 同 时 这 个 系统 也 是 建立 缺陷 跟踪 数据 库 的 
基础 ,有 助 于 进行 缺陷 的 收集 、 分 析 和 度量 ,从 而 进行 过 程 改进 和 提高 软件 质量 。 


.7 习题 


(K2) 在 系统 测试 过 程 中 ,下 面 哪个 度量 项 最 适合 衡量 测试 过 程 的 进度 ? ( ) 
.代码 的 测试 覆盖 率 

.发 现 并 修改 的 缺陷 数量 

. 缺陷 的 分 布 信息 

.测试 用 例 执行 数目 

(K1) 下 列 风险 中 ,属于 项 目 风 险 的 是 ( Yo 

. 软件 开发 商 交 付 的 软件 产品 无 法 安装 到 新 的 操作 系统 中 
.软件 开发 商 无 法 按时 交付 软件 产品 

. 软件 产品 内 的 功能 异常 

. 软件 的 性 能 没有 达到 要 求 

(CK1) 下 列 风险 中 ,属于 产品 风险 的 是 ( 和 

. 测试 项 目 中 测试 人 员 的 技能 不 足 

. 与 测试 人 员 进 行 需 求 和 测试 结果 沟通 方面 存在 的 问题 
. 软件 没有 按 用 户 需求 实现 既定 的 功能 

.供应 商 的 问题 

4. (K2) 可 能 的 独立 测试 的 类 型 有 哪些 ? ( ) 

(1) 没有 独立 的 测试 人 员 ,开发 人 员 测 试 自己 的 代码 

(2) 开发 团队 内 独立 的 测试 人 员 


:= 
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(3) 组 织 内 独立 的 测试 小 组 或 团队 ,向 项 目 经 理 或 执行 经 理 汇报 

(4) 来 自 业务 组 织 、 用 户 团体 内 的 独立 测试 人 员 

(5) 针对 特定 测试 类 型 的 独立 测试 专家 

(6) 外 包 或 组 织 外 的 独立 测试 人 员 

A. (5),(6) 

B. (C237 04)505) 

C. (2),(3),(4),(5),(6) 

BD: CIC) Cs) 6 

5.(K1) 以 下 不 属于 测试 组 长 的 主要 任务 的 是 ( 入 
A. 制定 或 评审 项 目的 测试 策略 和 组 织 的 测试 方针 
B. 决定 什么 应 该 自动 化 、 自 动 化 的 程度 ,以 及 如 何 实现 
C. 确定 对 测试 件 进行 配置 管理 ,以 保证 测试 件 (Testware) 的 可 追溯 性 
D. 分 析 、 评 审 和 评估 用 户 需 求 说 明 书 及 模型 的 可 测试 性 
6.(K1) 以 下 一 般 不 用 于 集成 测试 入口 准则 的 是 (。”)。 
A. 测试 环境 已 经 准备 就 绪 并 可 用 

B. 测试 环境 中 的 测试 工具 已 经 准备 就 绪 

C. 测试 数据 可 用 

D. 集成 测试 执行 结束 

7.〈(K2) 以 下 关于 测试 估算 的 描述 错误 的 是 ( 和 中 
A 

B. 

总 

BD: 

8 

A 

B. 

BD: 

A. 

县 

[4 

D. 


. 测试 工作 量 估算 可 以 采用 基于 度量 的 方法 
测试 工作 量 估算 可 以 采用 基于 专家 的 方法 
测试 工作 量 估算 会 受到 产品 的 特点 .开发 过 程 的 特点 的 影响 
测试 工作 量 估算 与 可 能 发 现 的 缺陷 数量 无 关 
(K1) 以 下 不 属于 测试 报告 的 主要 内 容 的 是 ( 和 
. 在 测试 阶段 发 生 了 什么 ,例如 达到 测试 出 口 准则 的 日 期 
通过 分 析 相 关 信息 和 度量 可 以 对 下 一 步 的 活动 提供 建议 和 做 出 决策 
对 仍然 存在 的 缺陷 的 评估 
为 已 定义 的 不 同 测试 任务 分 配 的 资源 
(K1) 下 面 哪个 不 属于 测试 控制 措施 ?( ) 
. 基于 测试 监控 信息 来 做 决策 
指定 测试 的 入 口 准则 和 出 口 准则 
如 果 一 个 已 识别 的 风险 发 生 , 重 新 确定 测试 优先 级 
根据 测试 环境 可 用 性 ,改变 测试 的 时 间 进 度 表 
0.(K1) 以 下 属于 项 目 风险 的 是 ( 和 5 
A. 与 测试 人 员 进 行 需求 和 测试 结果 沟通 方面 存在 的 问题 
B. 易 错 (Failure-prone) 的 软件 交付 使 用 


je 
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C. 软件 /硬件 对 个 人 或 公司 造成 伤害 的 可 能 性 

D. 劣质 的 软件 特征 (例如 功能 性 、 可 靠 性 、 可 用 性 和 性 能 等 ) 

. 《K2) 下 列 不 属于 事件 报告 的 主要 目的 和 作用 的 是 哪个 ? 〈 ) 

A. 为 开发 人 员 和 其 他 人 员 提 供 问 题 反 馈 ,在 需要 的 时 候 可 以 进行 识别 .隔离 和 纠正 
B. 为 测试 组 长 提供 一 种 有 效 跟踪 被 测 系统 的 质量 和 测试 进度 的 方法 

C. 提高 开发 人 员 的 编程 技能 

D. 为 测试 过 程 改 进 提供 资料 

12.(K1) 下 列 哪个 任务 应 该 是 测试 人 员 的 主要 职责 ? 〈 > 

A. 制定 测试 计划 与 测试 过 程 监控 

B. 选择 合适 项 目的 测试 工具 和 确定 所 使 用 的 测试 技术 

C. 建立 测试 环境 ,根据 需要 使 用 测试 管理 工具 

D. 编写 测试 报告 与 结果 分 析 

13. (K2) 制 定 测试 计划 的 时 候 , 下 列 哪个 因素 是 最 不 可 能 考虑 的 ? ( ) 

A. 识别 测试 目标 

B. 测试 的 入 口 准则 与 出 口 准则 

C. 测试 风险 

D. 测试 团队 的 合作 氛围 

14. (K1) 下 列 关于 配置 管理 的 描述 ,哪个 选项 是 不 正确 的 ? ( ) 

A. 配置 管理 可 以 帮助 测试 过 程 的 监控 

B. 配置 管理 帮助 识别 测试 文档 版 本 
€ 
D 


5 
few 


” 测试 计划 中 需要 选择 测试 配置 管理 工具 
.测试 相关 的 配置 管理 包括 测试 配置 项 的 识别 版 本 控制 与 变更 控制 等 
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学 习 目 标 
编号 学 习 目 标 描述 
LO-6.1.1 根据 测试 工具 的 用 途 和 基本 的 测试 过 程 和 软件 生命 周期 活动 ， 
对 不 同类 型 的 测试 工具 进行 分 类 
LO-6.1.2 ”解释 术语 “测试 工具 ”, 用 测试 工具 支持 测试 的 目的 
LO-6.2.1 总结 测试 自动 化 和 使 用 测试 工具 的 潜在 利益 和 风险 
LO-6.2.2 ” 记 住 使 用 测试 执行 工具 、 静 态 分 析 工 具 和 测试 管理 工具 时 应 当 
考虑 的 特定 因素 
LO-6. 3.1 ” 阅 述 将 工具 引入 组 织 中 的 主要 原则 
LO-6. 3.2 ”阐述 为 评估 工具 所 进行 的 调查 学 习 验 证 以 及 为 实施 工具 所 展开 
的 试点 阶段 的 目的 
LO-6. 3.3 ”识别 要 获得 好 的 工具 支持 , 仅 靠 购 置 工具 是 不 够 的 ,还 需要 考虑 


其 他 因素 


级 别 
K2 


K2 
K2 
Kl 


Kl 
Kl 
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术语 
术 语 含义 解 释 
Configuration 支持 对 配置 项 进行 识别 .控制 .变更 管理 .版 本 控制 和 
| 发 布 配置 项 基线 的 工具 
过 对 执行 测试 套件 能 够 覆盖 的 结构 元 素 如 语句 、 分 支 等 
Coverage Tool 覆盖 工具 进行 客观 测量 的 工具 
程序 员 用 来 复 现 软件 失败 研究 程序 状态 并 查找 相 
» 应 缺陷 的 工具 。 调 试 器 可 以 让 程序 员 单 步 执 行程 
ee 序 .在 任何 程序 语句 中 终止 程序 和 设置 .检查 程序 
变量 
ya le 为 程序 代码 提供 实时 信息 的 工具 ,通常 用 于 识别 未 定 
Ee 动态 分 析 工 具 义 的 指针 ,检测 指针 算法 和 内 存 地 址 分 配 、 使 用 及 释 
放 的 情况 以 及 对 内 存 泄露 进行 标记 
cet ini 辅助 记录 事件 并 对 事件 进行 状态 跟踪 的 工具 ,这 种 工 
et 事件 管理 工具 具 常 常 具 有 面向 工作 流 的 特性 ,以 跟踪 和 控制 事件 的 
资源 分 配 .更 正和 再 测试 ,并 提供 报表 
Load Testing Tool 负载 测试 工具 参见 Performance Testing Tool 
一 种 支持 性 能 测试 的 工具 ,通常 有 两 个 功能 : 负载 生 
Rn 成 和 测试 事务 测量 。 负 载 生成 可 以 模拟 多 用 户 或 者 
odl 性 能 测试 工具 大 量 输入 数据 。 执 行 时 ,对 选 定 的 事务 的 响应 时 间 进 
行 测量 并 记录 。 人 性 能 测试 工具 通常 会 生成 基于 测试 
日 志 的 报告 以 及 负载 对 应 响应 时 间 的 图 表 
Modeling Tool 建 模 工具 用 来 创建 ,修改 和 验证 软件 或 系统 模型 的 工具 
Monitoring Tool 监测 工具 /监视 工具 | 参见 Monitor 
与 被 测 组 件 / 系 统 同 时 运行 的 软件 工具 或 硬件 设备 ， 
ii 监测 器 /监视 器 。。 | 对 组 件 /系统 的 行为 进行 监视 .记录 和 分 析 
在 测试 时 测试 工具 (例如 性 能 测试 工具 或 监测 器 ) 对 
Probe Effect 探测 影响 组 件 /系统 产生 的 影响 。 例 如 ,使 用 性 能 测试 工具 可 
能 会 使 系统 的 性 能 有 小 幅度 降低 
对 评审 过 程 提供 支持 的 工具 ,典型 的 功能 包括 计划 评 
Review Tool 评审 工具 审 .跟踪 管理 .通信 支持 ,协同 评审 以 及 对 具体 度量 
(单位 ) 收 集 与 报告 的 存储 库 
Security Tool 安全 性 工具 提高 运行 安全 性 的 工具 
Static Analysis Tool | 静态 分 析 工 具 参见 Static Analyzer 
Static Analyzer 静态 分 析 器 执行 静态 分 析 的 工具 
Stress Testing Tool “| 压力 测试 工具 支持 压力 测试 的 工具 
Test Comparator 测试 比较 器 执行 自动 测试 比较 实际 结果 和 预期 结果 的 测试 工具 
Test Data Preparation | 测试 数据 准备 工具 一 种 测试 工具 ,用 于 从 已 存在 的 数据 库 中 挑选 数据 ， 


Tool 


或 创建 ,生成 .操作 和 编辑 数据 以 备 测试 
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续 表 
术 语 含义 解释 
通过 生成 测试 输入 来 支持 测试 设计 的 工具 。 测 试 输 
Test Design Tool 测试 设计 工具 人 可 能 来 源 于 CASE 工具 库 ( 如 需求 管理 工具 ) 中 包 
含 的 规格 ,工具 本 身 包含 的 特定 测试 条 件 
Tost Harmess 测试 用 具 包含 执行 测试 需要 的 桩 和 驱动 的 测试 环境 
Test Execution Tool 测试 执行 工具 ebro i 
对 测试 过 程 中 的 测试 管理 和 控制 部 分 提供 支持 的 工 
w 测试 管理 工具 具 。 它 通常 有 如 下 功能 : 测试 件 的 管理 ,测试 计划 的 


Management Tool 


制定 ,结果 纪录 、 过 程 跟踪 事件 管理 和 测试 报告 

运用 此 工具 可 以 为 单元 或 组 件 测试 提供 环境 ,在 此 环 
境 中 可 进行 隔离 测试 ,或 者 运用 适当 的 桩 或 驱动 程序 
进行 测试 。 同 时 也 可 以 为 开发 人 员 提供 相关 支持 , 例 
如 调试 能 力 

将 测试 输入 和 期 望 输出 保存 在 表格 中 的 一 种 脚本 技 
术 。 通 过 这 种 技术 ,运行 单个 控制 脚本 就 可 以 执行 表 
Data Driven Testing “| 数据 驱动 测试 格 中 所 有 的 测试 。 像 录制 /回放 这 样 的 测试 执行 工具 
经 常会 应 用 数据 驱动 测试 方法 , 参见 Keyword 
Driven Testing 

一 种 脚本 编写 技术 ,所 使 用 的 数据 文件 不 单 包含 测试 
Keyword Driven 忆 数据 和 预期 结果 ,还 包含 与 被 测 程序 相关 的 关键 词 。 
Testing 不 全 于 到 到 二 用 于 测试 的 控制 脚本 通过 调用 特别 的 辅助 脚本 来 解 
释 这 些 关键 词 

一 种 用 于 编写 可 执行 测试 脚本 (这 些 脚 本 被 测试 执行 
工具 使 用 ,如 录制 /回放 工具 ) 的 编程 语言 


Unit Test Framework | 单元 测试 框架 


Scripting Language 脚本 语言 


6.1 测试 工具 的 类 型 


测试 过 程 中 的 每 个 阶段 ,都 有 不 同 的 测试 工具 可 以 支持 测试 活动 。 本 章 主要 从 使 用 
测试 工具 的 意义 和 目的 入 手 . 讲 解 测试 工具 的 主要 分 类 ,以 及 测试 过 程 中 常用 的 一 些 工 
具 类 型 的 基本 原理 ,例如 测试 管理 工具 等 。 


6.1.1 使 用 测试 工具 的 意义 和 目的 


测试 工具 可 以 极 大 地 提升 测试 工作 的 效率 ,并 能 完成 手动 无 法 完成 的 一 些 测试 任 
务 ,前 提 是 要 用 正确 的 方法 使 用 正确 的 工具 。 不 同 的 测试 工具 ,可 以 支持 的 测试 活动 是 
不 同 的 ,例如 : 

(1) 直接 用 于 测试 的 工具 ,如 测试 执行 工具 、 测 试 数据 生成 工具 和 结果 对 比 工 具 。 
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(2) 测试 过 程 管 理工 具 , 如 用 于 管理 测试 .测试 结果 数据、 需求、 缺陷 等 的 工具 。 利 
用 这 些 工 具 还 可 以 报告 和 监控 测试 执行 。 

(3) 用 于 监测 被 测 对 象 的 工具 , 即 该 工具 起 到 监视 .记录 和 分 析 的 作用 ,如 监控 应 用 
程序 文件 活动 的 工具 。 

(4) 任何 对 测试 有 帮助 的 工具 ,从 这 个 意义 来 说 ,电子 表格 也 是 测试 工具 。 

根据 实际 情况 ,测试 工具 可 以 帮助 测试 人 员 达 到 如 下 目的 。 

(1) 可 以 通过 自动 化 方式 ,完成 一 些 重复 的 测试 任务 以 改进 测试 活动 的 效率 ,或 支持 
手动 测试 活动 ,如 支持 测试 计划 ,测试 设计 ,测试 报告 与 监控 等 活动 。 

(2) 当 手 动 进行 测试 需要 大 量 资源 时 ,可 使 用 自动 化 方式 执行 测试 ,例如 静态 分 
析 等 。 

(3) 无 法 手动 完成 的 测试 可 以 借助 于 相应 的 工具 完成 ,例如 基于 CS(Client / Server 
客户 机 /服务 器 ) 结 构 的 应 用 程序 的 大 规模 性 能 测试 。 

(4) 增加 测试 的 可 靠 性 ,例如 进行 大 量 数据 的 自动 比较 或 行为 模拟 分 析 。 

在 运作 良好 的 测试 团队 当中 ,测试 工具 往往 作为 一 个 重要 和 独立 的 方面 进行 管理 。 
任何 测试 工具 的 版 本 、 测 试 脚 本 或 测试 场景 ,都 应 该 处 于 配置 管理 之 下 并 与 被 测试 软件 
的 特定 版 本 绑 定 。 测 试 工具 的 管理 活动 主要 涉及 : 

(1) 建立 测试 工具 使 用 的 环境 和 框架 。 

(2) 保证 测试 工具 脚本 .工具 版 本 .补丁 信息 等 的 关联 性 ,并 处 于 配置 管理 之 下 。 

(3) 创建 和 维护 测试 脚本 库 ( 如 测试 用 例 中 相同 步骤 或 内 容 的 复 用 )、 把 测试 工具 执 
行 方 法 文档 化 (如 组 织 中 使 用 工具 的 过 程 ) 。 

(4) 为 后 续 开发 和 实现 结构 化 的 测试 用 例 做 准备 ,例如 使 它们 具有 可 扩展 性 和 维 
护 性 。 


6.1.2 测试 工具 分 类 


在 测试 过 程 中 会 使 用 到 很 多 工具 ,如 需求 管理 工具 、 测 试管 理工 具 、 缺 陷 ( 事 件 ) 管 理 
工具 .静态 分 析 工 具 ,动态 分 析 工 具 ,测试 设计 工具 、 自 动 化 测试 执行 工具 、 性 能 测试 工具 
等 ,还 有 很 多 有 用 的 辅助 工具 ,如 数据 对 比 工具 、 文 档 编辑 工具 、 配 置 管理 工具 、 监 测 器 
等 。 这 些 测试 工具 可 以 支持 不 同类 型 的 测试 活动 。 测 试 工具 可 以 按照 不 同 的 规则 进行 
分 类 ,例如 ,可 以 按 不 同 的 目的 分 类 ,也 可 以 按 商 业 工具 、 免 费 工 具 、 开 源 工具 和 共享 工具 
来 分 类 ,或 按 工具 使 用 的 技术 进行 分 类 。 下 面 将 按照 测试 工具 能 支持 的 测试 活动 来 进行 
分 类 ,主要 可 以 分 如 下 几 大 类 。 

(1) 测试 管理 工具 。 

(2) 静态 测试 工具 。 

(3) 测试 设计 工具 。 

(4) 测试 执行 和 记录 工具 。 
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(5) 性 能 测试 和 监测 工具 。 

(6) 特定 应 用 领域 的 工具 。 

有 些 工 具 只 支持 一 种 测试 活动 ,而 有 些 工具 能 支持 多 种 测试 活动 ,此 时 测试 工具 可 
以 按照 其 最 明确 支持 的 活动 进行 分 类 。 有 些 测试 工具 通过 自动 化 重复 性 的 工作 来 提高 
测试 的 效率 ,测试 工具 也 可 以 通过 诸如 大 量 数据 比较 的 自动 化 或 模拟 系统 的 行为 来 改善 
和 提高 测试 的 可 靠 性 。 

有 些 类 型 的 测试 工具 本 身 是 植 和 人 式 的 ,工具 本 身 会 影响 测试 对 象 的 行为 ,例如 使 用 
不 同 的 性 能 测试 工具 测 出 来 的 实际 时 间 特 征 会 有 所 不 同 ,或 使 用 不 同 的 覆盖 率 分 析 器 工 
具 可 能 测量 出 不 同 的 覆盖 率 ,在 使 用 这 些 工 具 时 也 应 该 很 好 地 关注 这 些 特征 。 

下 面 将 分 别 介绍 能 支持 不 同 测试 活动 的 工具 类 型 。 


6.1.3 测试 管理 的 工具 支持 


这 里 列举 的 管理 工具 适用 于 整个 软件 生命 周期 中 的 所 有 测试 活动 。 
1. 测试 管理 工具 


测试 管理 工具 能 有 效 管理 整个 测试 过 程 ,这 些 工 具 自身 往往 集成 了 需求 管理 ,事件 
管理 并 有 配置 管理 的 支撑 ,或 提供 与 测试 执行 .事件 跟踪 和 管理 .需求 管理 的 接口 。 作 为 
管理 工具 的 另 一 个 特征 是 能 提供 定量 分 析 报 告 。 有 配置 管理 的 支持 ,测试 管理 工具 能 在 
需求 ,测试 条 件 、 测 试用 例 甚至 是 测试 结果 间 进 行 双向 追溯 ,并 可 提供 独立 的 版 本 控制 
能 力 。 

由 于 测试 管理 工具 往往 需要 管理 多 个 项 目 ,不 同 的 项 目 可 能 对 应 不 同 的 客户 /用 户 ， 
不 同 的 客户 /用 户 又 可 能 有 不 同 的 需求 。 这 就 要 求 测试 管理 工具 能 提供 多 种 接口 ,通过 
接口 调用 常用 的 其 他 工具 。 例 如 ,通过 测试 管理 工具 能 管理 测试 用 例 , 执 行 某 个 测试 用 
例 时 只 需 通 过 测试 管理 工具 的 接口 调用 相应 自动 化 执行 工具 ,再 由 自动 化 测试 工具 运行 
相应 的 测试 脚本 ,测试 的 结果 再 通过 接口 反馈 给 测试 管理 工具 统一 进行 管理 。 这 里 , 测 
试管 理工 具 应 该 能 提供 多 种 不 同 自动 化 测试 工具 的 接口 。 

通常 情况 下 ,测试 管理 工具 能 对 测试 过 程 进 行 全 方位 和 无 缝 的 管理 ,这 些 管理 包括 
管理 需求 .规划 测试 、 开 发 和 维护 测试 用 例 、 执 行 测试 .管理 事件 (缺陷 ) 报 告 , 管 理 测试 结 
果 , 并 以 直观 和 容易 理解 的 方式 输出 测试 的 总 结 报告 。 

由 于 配置 管理 工具 的 支持 ,使 得 测试 管理 工具 具有 很 好 的 可 追溯 性 ,可 以 从 测试 结 
果 追 溯 到 测试 用 例 , 从 测试 用 例 又 可 追溯 到 需求 ,也 可 很 方便 地 从 需求 找到 相应 的 测试 
用 例 。 在 测试 管理 工具 中 不 仅 统一 保存 了 各 种 相关 文档 (包括 测试 用 例 、 测 试 脚本 、 事 件 
报告 ) 和 测试 结果 以 及 测试 环境 等 ,并 且 还 保存 了 它们 的 历史 数据 以 及 它们 的 关联 性 
(配置 ) 。 
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2. 需求 管理 工具 


测试 的 标准 最 终 要 追溯 到 需求 ,需求 的 质量 直接 影响 到 测试 的 质量 。 同 时 ,测试 还 
要 考虑 覆盖 需求 。 这 就 需要 对 需求 进行 有 效 管 理 。 使 用 需求 管理 工具 能 有 效 避 免 需求 
间 的 自 相 矛 盾 、 宛 余 的 需求 或 遗漏 的 需求 等 。 需 求 管理 工具 存储 了 需求 的 描述 和 其 他 属 
性 (例如 优先 级 ) ,为 每 个 需求 提供 唯一 的 标识 符 , 并 保证 了 从 需求 到 相应 测试 用 例 的 可 
追溯 性 。 

使 用 统一 的 需求 管理 工具 也 能 有 效 避 免 开 发 过 程 所 使 用 的 需求 与 测试 过 程 所 使 用 
的 需求 的 不 一 致 性 。 


3. 缺陷 管理 工具 


缺陷 管理 工具 存储 并 管理 缺陷 报告 , 它 在 缺陷 的 整个 生命 周期 内 能 对 缺陷 进行 有 效 
管理 ,并 根据 需要 对 缺陷 进行 分 析 。 


4. 配置 管理 工具 


严格 来 说 ,配置 管理 工具 并 不 能 算是 真正 的 测试 工具 ,但 在 对 测试 件 和 相关 软件 的 
存储 和 版 本 管理 时 却 是 必要 的 ,尤其 是 配置 多 个 硬件 /软件 环境 的 时 候 , 例 如 操作 系统 版 
本 、 编 译 器 、 浏 览 器 等 。 

测试 过 程 中 需要 综合 运用 各 种 测试 工具 ,而 测试 工具 与 其 他 一 些 工具 的 组 合 也 变 得 
越 来 越 重 要 ,特别 是 测试 管理 工具 。 综 合 运 用 测试 工具 可 以 完整 地 跟踪 测试 状态 ,从 需 
求 到 测试 用 例 和 测试 结果 ,再 到 缺陷 报告 和 代码 变更 ,例如 : 

(1) 需求 可 从 需求 管理 工具 中 导入 ,并 用 于 制定 测试 计划 。 这 样 就 可 以 在 需求 管理 
工具 或 测试 管理 工具 中 观察 和 跟踪 每 个 需求 的 测试 状态 。 

(2) 测试 执行 工具 可 从 测试 管理 工具 中 启动 并 获取 测试 规程 。 测 试 结果 自动 返回 测 
试管 理工 具 并 归档 。 

(3) 通常 ,测试 管理 工具 和 缺陷 管理 工具 都 是 联合 使 用 的 。 因 此 ,可 以 生成 确认 测试 
(再 测试 ) 的 计划 ,也 就 是 用 于 验证 最 新 版 本 的 测试 对 象 中 缺陷 是 否 已 被 成 功 修 正 的 一 系 
列 必要 的 测试 用 例 。 

(4) 通过 配置 管理 ,每 次 代码 变更 都 能 够 关联 到 某 缺 陷 或 变更 请 求 。 

测试 管理 工具 和 缺陷 管理 工具 具备 丰富 的 分 析 和 报表 功能 ,因此 可 以 借助 这 些 测试 
工具 得 到 数据 生成 完整 的 测试 文档 ,例如 测试 报告 。 通 过 测试 工具 收集 的 数据 可 以 按 多 
种 方式 进行 量化 评估 ,例如 ,确定 已 运行 的 测试 用 例 的 数量 ,以 及 成 功 运行 的 测试 用 例 的 
数量 ,或 者 测试 过 程 中 发 现 属于 某 个 特定 缺陷 类 型 的 失效 的 频率 。 这 些 信息 有 助 于 评估 
测试 的 进度 和 管理 测试 的 过 程 。 
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6.1.4 静态 测试 的 工具 支持 


静态 测试 工具 提供 了 一 种 在 开发 过 程 的 早期 发 现 尽 可 能 多 的 缺陷 的 高 性 价 比 的 
手段 。 


1. 评审 工具 


这 类 工具 可 支持 评审 过 程 、 检 查 表 、 评 审 指导 方针 ,并 且 能 用 于 存储 和 交流 评审 意 
见 、 以 及 缺陷 和 工作 量 报告 ,还 能 进一步 为 庞大 的 或 分 布 于 不 同 地 区 的 团队 提供 在 线 评 
审 支持 。 


2. 静态 分 析 工具 (D)O 


这 类 工具 通过 提供 对 标准 编码 规范 、 结 构 和 其 相关 性 分 析 的 支持 ,从 而 帮助 开发 和 
测试 人 员 在 动态 测试 之 前 尽早 发 现 一 些 缺陷 或 隐患 。 这 类 工具 也 可 以 对 代码 进行 度量 
(例如 复杂 性 ) ,以 支持 风险 分 析 和 测试 计划 制订 。 

静态 分 析 工 具 通 常 是 由 开发 人 员 在 组 件 测试 和 集成 测试 之 前 使 用 的 辅助 工具 。 在 
进行 静态 分 析 时 ,不 需要 运行 被 测试 的 程序 ,而 是 通过 运行 静态 分 析 工 具 对 程序 代码 进 
行 检查 。 例 如 ,可 以 对 程序 的 数据 流 和 控制 流 信 息 进行 分 析 , 找 出 系统 的 缺陷 或 缺陷 的 
隐患 ,得 出 测试 分 析 报 告 。 在 开发 的 早期 进行 静态 分 析 能 提高 软件 的 质量 、 降 低 质 量 保 
障 的 成 本 ,但 是 用 人 工 阅 读 代码 的 方法 工作 量 巨 大 ,所 以 产生 了 专门 对 软件 进行 静态 分 
析 的 测试 工具 。 

静态 分 析 工 具 发 现 的 典型 问题 请 参见 3. 3 节 。 

静态 分 析 工 具 与 人 工 进行 分 析 的 方式 相 比 ,一 方面 能 提高 分 析 工 作 的 效率 , 另 一 方 
面 也 能 保证 分 析 的 全 面 性 、 可 靠 性 和 正确 性 。 

静态 分 析 工 具 直 接 对 代码 进行 分 析 , 不 需要 运行 代码 ,也 不 需要 对 代码 进行 编译 、 连 
接 和 生成 可 执行 文件 。 它 一 般 是 对 代码 进行 语法 扫描 , 找 出 不 符合 编码 规范 的 地 方 , 根 
据 某 种 质量 模型 评价 代码 的 质量 ,生成 系统 的 调用 关系 图 等 。 


3, 建 模 工具 (D) 


建 模 工具 可 以 用 来 确认 软件 模型 (例如 关系 型 数据 库 的 物理 数据 模型 ), 可 以 列举 其 
不 一 致 性 并 发 现 缺 陷 。 它 们 通常 也 用 于 生成 一 些 基 于 模型 的 测试 用 例 。 


6.1.5 测试 说 明 的 工具 支持 
测试 设计 工具 能 够 根据 需求 .图 形 用 户 界面 (GUID 、 设 计 模型 (状态 .数据 或 对 象 ) 或 


@ 这 里 的 (D) 表 示 该 类 工具 更 多 的 是 由 开发 人 员 来 使 用 的 。 
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代码 生成 测试 用 例 或 其 中 的 一 部 分 。 
1. 测试 设计 工具 


测试 设计 工具 可 以 根据 以 下 参考 输入 生成 测试 用 例 。 

(1) 需求 文档 : 测试 人 员 从 需求 文档 出 发 ,为 每 个 需求 设计 出 相应 的 测试 用 例 并 不 
困难 ,但 是 要 考虑 需求 与 需求 间 的 相互 作用 和 所 有 可 能 的 组 合 ,这 就 非常 困难 。 而 如 果 
使 用 测试 设计 工具 辅助 从 需求 文档 生成 测试 用 例 , 就 会 考虑 到 所 有 可 能 的 组 合 ,避免 遗 
漏 一 些 场景 。 从 需求 文档 自动 生成 测试 用 例 的 前 提 是 需求 文档 必须 严格 按照 工具 规定 
的 格式 书写 ,否则 工具 就 无 法 识别 和 分 析 。 通 常 所 生成 的 测试 用 例 数目 也 非常 庞大 , 需 
要 人 工 筛 选 出 有 意义 的 组 合 。 另 外 ,所 生成 的 测试 用 例 一 般 也 只 是 测试 用 例 框 架 , 需 要 
人 工 完 善 。 

(2) 图 形 用 户 界面 : 对 图 形 用 户 界 面 的 测试 尽管 可 以 使 用 一 些 有 效 的 测试 技术 支 
持 , 例 如 使 用 基于 状态 转换 的 测试 方法 等 ,但 往往 还 是 比较 复杂 和 繁琐 ,很 难 去 考虑 各 个 
屏幕 上 元 素 间 的 组 合 、 不 同 路 径 和 顺序 可 能 的 输出 结果 。 而 如 果 使 用 测试 设计 工具 ,这 
些 繁琐 和 复杂 的 工作 就 由 工具 自动 执行 。 工 具 能 自动 从 屏幕 获取 这 些 元 素 并 考虑 各 种 
可 能 的 组 合 等 ,同时 生成 相应 的 测试 用 例 ( 框 架 )。 但 是 , 当 生 成 的 测试 用 例 的 数目 非常 
庞大 的 时 候 , 还 需要 从 这 些 众多 的 测试 用 例 ( 框 架 ) 中 选择 一 些 有 意义 的 测试 用 例 并 进行 
完善 。 

(3) 设计 模型 (状态 .数据 或 对 象 ) : 测试 设计 工具 也 可 以 从 系统 或 产品 的 模型 自动 
生成 测试 用 例 ,例如 ,用 统一 建 模 语言 (Unified Modeling Language, UML) 对 系统 或 产品 
建 模 后 ,可 以 使 用 测试 设计 工具 阅读 和 分 析 模 型 并 设计 出 相应 的 测试 用 例 ,甚至 可 以 生 
成 自动 化 测试 脚本 ,进行 自动 化 测试 ,从 而 可 以 快速 验证 实际 系统 或 产品 是 否 与 模型 一 
致 。 这 种 方法 能 有 效应 对 各 种 变更 ,例如 需求 变更 或 技术 更 新 后 ,只 要 修改 或 重 构 模 型 ， 
运行 测试 设计 工具 生成 测试 脚本 , 即 可 验证 实际 系统 是 否 与 模型 一 致 。 

(4) 代码 : 还 有 些 测试 设计 工具 可 以 阅读 和 分 析 程 序 的 代码 ,可 以 根据 代码 的 结构 
以 及 测试 的 要 求 自 动 设计 出 相应 的 测试 用 例 。 例 如 ,可 以 要 求 覆 盖 所 有 的 可 执行 的 代码 
语句 或 至 少 履 盖 所 有 判定 分 支 的 85% 等 。 

通过 工具 设计 测试 用 例 的 一 个 前 提 条 件 是 要 保证 工具 能 识别 这 些 输 入 ,对 这 些 输入 
的 编写 要 求 很 高 。 例 如 需求 必须 符合 特定 的 格式 ,甚至 使 用 特定 的 描述 语言 。 另 外 , 测 
试 设计 是 个 创造 性 的 工作 ,只 能 使 用 工具 来 提高 效率 ,挖掘 更 深入 且 往 往 会 被 忽略 的 组 
合 等 。 但 测试 设计 工具 无 法 检查 出 这 些 输 入 本 身 的 逻辑 和 理解 的 错误 ,例如 ,需求 内 的 
逻辑 错误 ,模型 本 身 的 错误 等 。 

需要 注意 的 是 ,有 了 时候 测 试 设计 工具 不 能 生成 完整 的 测试 用 例 ,而 只 是 生成 了 测试 
用 例 的 输入 和 测试 用 例 的 期 望 结果 作为 测试 用 例 的 框架 。 


2. 测试 数据 成 生 工 具 
随 着 各 种 信息 的 不 断 涌 入 ,大 数据 时 代 已 经 来 临 ,为 了 更 好 地 模拟 用 户 的 真实 场景 ， 
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或 者 覆盖 更 多 的 测试 输入 ,在 测试 过 程 中 需要 大 量 的 数据 。 测 试 数据 生成 工具 用 来 处 理 
数据 库 、 文 件 或 数据 传输 ,并 且 生 成 可 以 在 测试 执行 过 程 中 使 用 的 测试 数据 ,并 通过 数据 
匿名 来 确保 安全 性 。 


6.1.6 测试 执行 和 记录 工具 


自动 化 的 测试 执行 工具 把 测试 人 员 从 机 械 化 的 测试 执行 任务 中 解放 出 来 。 测 试 执 
行 工 具 给 测试 对 象 提供 测试 数据 ,记录 测试 对 象 的 反应 。 当 这 种 工具 与 测试 对 象 运行 在 
同一 平台 时 ,可 能 会 影响 测试 对 象 运行 时 的 行为 (例如 占 内 存 的 容量 和 消耗 处 理 器 时 间 ) 
和 测试 结果 ,所 以 在 使 用 这 种 工具 执行 测试 和 评估 结果 时 应 加 以 关注 。 由 于 测试 执行 工 
具 需 要 和 测试 对 象 的 特定 测试 接口 相连 接 ,因此 这 些 工具 对 于 不 同 测试 级 别 (例如 组 件 、 
集成 .系统 测试 ) 会 有 很 大 的 差别 。 

测试 驱动 器 或 测试 用 具 可 以 是 商业 化 的 产品 ,也 可 以 是 单独 开发 的 工具 ,它们 提供 
通过 测试 对 象 的 编程 接口 对 被 测 对 象 执 行 测试 的 功能 。 也 可 用 于 测试 那些 没有 用 户 界 
面 的 测试 对 象 , 因 为 对 没有 用 户 界 面 的 测试 对 象 的 测试 往往 是 手工 无 法 直接 操作 的 。 测 
试用 具 主 要 用 于 组 件 测试 和 集成 测试 ,或 者 完成 部 分 系统 测试 中 的 特殊 任务 。 此 外 , 通 
用 测试 驱动 器 或 测试 台 生 成 器 能 对 测试 对 象 的 编程 接口 进行 分 析 并 生成 测试 用 具 。 
此 ,这 种 工具 是 为 特定 编程 语言 或 开发 环境 定制 的 。 生 成 的 测试 用 具 包 括 必要 的 初始 化 
和 调用 序列 ,以 驱动 测试 对 象 。 如 果 有 必要 ,工具 还 会 创建 虚设 备 或 桩 ,以 及 用 来 记录 目 
标 反 应 和 测试 日 志 的 函数 。 因 此 ,测试 用 具 ( 生 成 器 ) 显 著 降低 了 测试 环境 的 编程 工作 
量 。 互 联网 上 有 一 些 免 费 的 通用 解决 方案 (测试 框架 ) 。 

如 果 软 件 系 统 的 用 户 界面 直接 用 作 测 试 界面 ,那么 可 以 使 用 所 谓 的 测试 机 器 人 
(Test Robot)。 这 些 工 具 传 统 上 叫做 捕获 / 重 放 (Capture/Replay) 或 捕获 /回放 工具 
(Capture/Playback Tool) 。 在 测试 过 程 中 ,使 用 捕获 /回放 工具 的 过 程 如 下 。 

(1) 准备 捕获 : 保证 要 自动 化 测试 的 用 例 已 经 设计 完毕 ,并 形成 文档 。 

(2) 进行 捕获 : 打开 自动 化 测试 工具 ,启动 录制 功能 , 按 测试 用 例 中 的 描述 ,操作 被 
测 的 应 用 程序 。 这 时 ,所 有 的 操作 都 以 脚本 的 形式 被 录制 。 

(3) 编辑 测试 脚本 : 对 录制 的 脚本 进行 处 理 ,通过 加 入 检测 点 ,比较 期 望 的 结果 与 实 
际 的 结果 ,比较 的 结果 可 以 是 中 间 结 果 , 也 可 以 是 最 终结 果 。 并 可 以 通过 添加 分 支 .循环 
等 控制 语句 ,增强 测试 脚本 的 功能 。 

(4) 调试 脚本 : 对 成 生 的 测试 用 例 自动 化 测试 脚本 进行 调试 ,以 保证 测试 脚本 的 正 
确 性 。 

(5) 运行 测试 : 通过 自动 化 测试 工具 运行 测试 脚本 ,以 确认 软件 的 正确 性 ,实现 测试 
执行 的 自动 化 。 

(6) 分 析 结 果 和 报告 问题 : 查看 测试 自动 化 工具 记录 的 运行 结果 和 问题 ,报告 测试 
结果 。 
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6.1.7 性 能 测试 工具 和 监测 器 


这 里 主要 包括 动态 分 析 工 具 、 性 能 测试 工具 和 监控 工具 。 
1. 动态 分 析 工 具 


在 测试 执行 时 ,动态 分 析 工 具 可 以 获取 额外 的 被 测 软件 内 部 状态 信息 ,例如 有 关内 
存 分 配 、 使 用 和 释放 的 信息 。 因 此 ,使 用 动态 分 析 工 具 能 有 效 发 现 内 存 泄漏 、 指 针 分 配 或 
指针 运算 等 问题 。 


2. 性 能 测试 /负载 测试 /压力 测试 工具 


性 能 测试 工具 实际 上 是 一 种 模拟 软件 运行 环境 的 工具 , 它 有 助 于 在 实验 室 里 搭建 出 
需要 的 测试 环境 ,通过 性 能 测试 工具 检验 被 测试 对 象 是 否 达到 客户 所 要 求 的 性 能 指标 。 
通过 分 析 性 能 测试 工具 给 出 的 数据 能 发 现 各 种 问题 和 性 能 瓶颈 ,有 助 于 进一步 改善 系统 
性 能 。 现 在 ,基于 Web 是 软件 系统 发 展 的 一 个 趋势 ,性 能 测试 也 就 变 得 比 以 往 更 加 重 
要 ,性 能 测试 工具 也 自然 会 在 软件 测试 过 程 中 被 更 多 地 使 用 。 

性 能 测试 工具 监测 和 报告 系统 模拟 大 量 并 发 用 户 使 用 系统 时 的 性 能 表现 。 通 常 所 
说 的 性 能 测试 工具 往往 包含 了 负载 测试 和 压力 测试 的 功能 ,通过 持续 不 断 地 增加 并 发 使 
用 系统 的 用 户 数目 来 获得 系统 能 承受 的 最 大 负载 ,以 及 系统 的 一 些 与 时 间 相 关 的 特性 ， 
例如 ,使 用 系统 的 并 发 用 户 数 与 系统 处 理 业 务 时 间 的 关系 等 。 另 外 ,还 可 以 通过 性 能 测 
试 工具 发 现 系统 的 问题 和 瓶颈 ,从 而 可 以 采取 优化 措施 (系统 调 优 )。 这 里 作为 系统 负载 
的 并 发 用 户 是 由 工具 的 负载 生成 器 模拟 生成 的 虚拟 用 户 , 这 些 虚 拟 用 户 可 以 分 布 在 不 同 
的 测试 机 上 。 

3. 监控 工具 

在 性 能 测试 过 程 中 ,除了 需要 通过 负载 生成 器 模拟 生成 虚拟 用 户外 ,还 需要 通过 监 
测 器 监测 系统 某 些 点 的 变化 情况 ,例如 系统 的 网 络 、 服 务 器 数据库、 网 络 设备 等 ,从 而 获 


得 系统 的 性 能 数据 ,通过 对 这 些 数据 的 分 析 , 快 速 、 高 效 地 发 现 系 统 的 问题 。 严 格 地 说 ， 
监测 器 本 身 不 属于 测试 工具 ,但 是 在 做 性 能 测试 时 却 不 能 缺少 监测 器 。 


(6.2 有 效 使 用 工具 : 可 能 的 收益 与 风险 


在 测试 过 程 中 使 用 工具 的 目的 是 提高 测试 效率 、 保 障 测试 质量 。 这 就 需要 让 测试 工 
具 发 挥 其 应 有 的 作用 ,给 测试 带 来 收益 。 但 是 仅仅 靠 购买 或 租用 工具 并 不 能 保证 成 功 使 
用 这 些 工 具 。 要 让 工具 带 来 真正 且 持续 的 收益 还 需要 很 多 额外 的 工作 。 在 考虑 工具 带 
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来 的 收益 的 同时 ,还 要 考虑 使 用 工具 可 能 的 风险 。 

使 用 工具 可 能 的 收益 包括 : 

(1) 能 完成 人 工 无 法 完成 的 测试 工作 。 例 如 ,没有 性 能 测试 工具 的 支持 , 仅 靠 人 工 操 
作 几 乎 无 法 执行 性 能 测试 ,因为 不 可 能 召集 几 百 几 千 个 测试 人 员 同 步 并 行 地 操作 被 测 系 
统 ; 同样 ,有 些 分 析 工 具 能 完成 人 工 几 乎 无 法 完成 的 测试 任务 ,例如 需要 长 时 间 操 作 的 
测试 。 

(2) 能 蔡 代 人 工 进 行 重复 性 的 工作 。 例 如 ,使 用 自动 化 执行 工具 持续 不 断 进行 回归 
测试 ; 针对 相同 的 测试 脚本 采用 不 同 的 输入 数据 (数据 驱动 ) 进 行 测试 ; 静态 分 析 工 具 持 
续 对 代码 进行 检查 等 。 

(3) 能 更 好 地 保持 一 致 性 和 可 重复 性 。 例 如 ,使 用 自动 化 执行 工具 时 ,一 般 只 要 按照 
相同 的 顺序 (测试 脚本 ) 和 相同 的 输入 并 保持 相同 的 环境 ,输出 结果 可 以 保持 一 致 并 可 重 
复 ; 使 用 测试 设计 工具 从 需求 生成 测试 用 例 时 也 能 高 度 保持 一 致 性 和 可 重复 性 。 

(4) 能 保证 客观 的 评 佑 。 例 如 ,使 用 静态 分 析 工 具 对 程序 代码 (组 件 /模块 ) 进 行 复杂 
程度 分 析 ; 可 以 使 用 基于 结构 的 测试 ( 白 盒 测试 ) 工 具 根 据 覆 盖 要 求 对 代码 进行 测试 ,这 
里 的 覆盖 率 能 客观 地 量化 和 评估 。 

(5) 能 容易 得 到 测试 相关 的 信息 。 软 件 测试 的 目的 之 一 是 要 向 利益 相关 者 提供 和 测 
试 相关 信息 ,以 帮助 他 们 对 这 些 信 息 进行 分 析 和 评估 ; 这 些 信息 可 以 协助 确定 软件 的 发 
布 与 否 ; 这 些 信息 也 可 以 验证 测试 计划 以 及 协助 制定 测试 计划 。 这 些 信息 可 以 是 关于 测 
试 进展 的 统计 和 图 表 、 有 关 缺 陷 ( 事 件 ) 的 信息 和 性 能 方面 的 信息 等 。 

(6) 能 提升 测试 人 员 和 测试 团队 的 技能 水 平 。 工 具 通 常 可 以 针对 某 些 方面 提供 系统 
化 的 解决 方案 ,从 工具 的 操作 中 ,测试 人 员 可 以 系统 地 了 解 很 多 测试 和 管理 知识 。 例 如 ， 
通过 学 习 和 使 用 测试 管理 工具 ,测试 人 员 可 以 更 好 地 了 解 测试 的 流程 。 

虽然 使 用 工具 可 以 给 测试 团队 带 来 很 多 好 处 ,但 是 也 存在 潜在 的 风险 ,包括 : 

(1) 对 工具 抱 有 不 切实 际 的 期 望 。 这 是 在 那些 缺少 自动 化 测试 经 验 的 企业 和 组 织 中 
常见 的 风险 。 由 于 测试 过 程 的 不 完善 .测试 管理 的 混乱 ,总 是 希望 能 使 用 一 些 新 的 工具 
帮 他 们 解决 这 些 问 题 ,至 少 能 将 问题 简化 。 但 非常 可 异 的 是 ,测试 工具 无 法 完成 这 些 任 
务 ,如 果 测 试 过 程 和 管理 的 问题 没有 解决 ,而 是 盲目 地 引入 工具 ,试图 通过 工具 本 身 来 解 
决 这 些 问 题 , 那 结局 可 能 是 更 加 混乱 。 所 以 应 确保 对 测试 工具 有 合理 的 期 望 ,包括 工具 
的 功能 和 特性 以 及 能 带 来 的 收益 。 

(2) 低估 首次 引入 工具 所 需 的 时 间 、 成 本 和 工作 量 。 对 一 些 缺 乏 经 验 的 测试 人 员 或 
经 理 , 当 看 到 供应 商 给 出 的 示例 中 ,在 30 分 钟 内 测试 了 数 十 个 界面 或 几 百 万 行 代码 , 特 
别 是 对 捕获 /回放 功能 ,以 为 测试 真 的 可 以 一 键 完成 ,会 认为 这 就 是 工具 的 效果 。 然 而 ， 
一 个 经 过 精心 准备 和 包装 的 示例 与 在 整个 组 织 中 推广 一 个 工具 是 完全 不 同 的 概念 。 工 
具 的 首次 引入 需要 从 企业 和 组 织 对 工具 的 需求 分 析 开 始 , 在 测试 过 程 中 是 否 需 要 使 用 工 
具 , 需 要 什么 样 的 工具 ,应 该 具有 哪些 功能 ,是 使 用 开源 还 是 商业 工具 。 对 企业 和 组 织 自 
身 的 了 解 ,包括 现存 的 测试 过 程 、 正 在 使 用 的 工具 、 人 员 的 资质 等 ,因为 引入 新 工具 是 与 
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这 些 因素 密切 相关 的 。 还 需要 对 工具 的 使 用 者 进行 培训 ,包括 外 部 培训 等 。 

(3) 低估 从 工具 中 获得 较 大 和 持续 性 收益 需要 付出 的 时 间 和 工作 量 。 很 多 企业 和 组 
织 花 费 了 数 年 时 间 才 在 测试 投资 上 获得 了 收益 。 而 这 些 获得 收益 的 企业 和 组 织 还 算是 
幸运 的 ,还 有 很 多 企业 和 组 织 因 不 正确 地 引入 工具 ,最 终 导致 亏损 而 放弃 使 用 这 些 工具 。 
要 从 工具 中 获得 较 大 和 持续 性 的 收益 ,需要 花 大 量 的 时 间 去 建立 测试 框架 .与 其 他 工具 
集成 ,为 工具 的 使 用 制定 标准 和 指南 ,为 使 用 工具 的 方式 而 更 改 测试 过 程 并 不 断 改进 。 

(4) 低估 了 要 让 工具 带 来 收益 而 需 进 行 工 具 维 护 的 工作 量 。 有 些 企 业 和 组 织 会 减少 
初始 的 测试 开发 的 投入 以 及 工具 使 用 的 培训 的 投入 ,创建 一 些 脆 弱 的 、 难 以 维护 的 测试 
脚本 。 例 如 ,简单 使 用 捕获 /回放 功能 快速 生成 的 测试 脚本 。 这 些 测试 脚本 会 给 以 后 的 
维护 带 来 困难 ,无 法 面 对 频 繁 的 (被 测 软件 系统 和 环境 ) 变 更 ,大 大 增加 了 维护 的 费用 。 
另外 ,很 多 企业 和 组 织 无 法 恰当 地 预 估 测试 维护 的 预算 ,降低 了 测试 自动 化 的 投资 回报 
率 。 工具 的 维护 包括 工具 本 身 的 更 新 换代 ,供应 商 的 技术 支持 、 以 及 相应 使 用 环境 和 上 脚 
本 的 维护 等 。 

(5) 对 测试 工具 过 分 依赖 。 有 些 企业 和 组 织 会 过 分 依赖 某 些 工具 ,认为 有 了 这 些 工 
具 就 可 以 有 效 地 完成 测试 任务 ,这 是 非常 危险 的 。 有 些 工具 (例如 测试 设计 工具 ) 能 协助 
测试 员 更 好 地 提高 工作 效率 。 但 这 些 工 具 并 不 能 完全 替代 人 工 的 工作 ,因为 测试 设计 需 
要 创造 性 和 灵感 。 如 果 过 分 依赖 这 些 工具 而 忽视 了 人 的 因素 ,可 能 会 严重 影响 测试 设计 
的 质量 。 有 了 时, 人们 试图 将 测试 的 执行 100% 自 动 化 ,久而久之 放松 了 对 测试 对 象 和 测试 
用 例 的 学 习 和 理解 ,从 而 无 法 有 效 进行 维护 ,降低 了 测试 的 质量 。 在 某 些 情况 下 ,可 能 更 
适合 人 工 测试 ,因为 在 这 些 情况 下 使 用 自动 化 测试 .会 导致 更 大 的 风险 和 需要 更 多 的 开 
销 ( 人 力 、 时 间 、 费 用 )。 

(6) 忽视 了 多 个 重要 工具 之 间 的 关联 和 互 操 作 性 。 工 具 的 引入 不 是 孤立 的 , 它 与 很 
多 方面 都 有 关联 ,例如 ,新 的 工具 与 原 有 已 经 在 组 织 内 使 用 的 工具 的 关系 ,与 组 织 内 使 用 
的 测试 过 程 的 关系 .与 使 用 工具 的 人 员 的 关系 等 。 引 入 工具 时 应 该 考虑 与 现 有 的 需求 管 
理工 具 ,版 本 控制 工具 、 缺 陷 ( 事 件 ) 管 理 和 跟踪 工具 ,自动 化 测试 执行 工具 和 其 他 从 不 同 
供应 商 获得 的 工具 的 关联 和 互 操作 性 。 

(7) 其 他 风险 。 包 括 工具 供应 商 破产 、 停 止 维 护 工具 或 将 工具 卖 给 其 他 供应 商 的 风 
险 ; 供应 商 对 工具 的 支持 、 升 级 和 缺陷 修复 反应 不 及 时 的 风险 ; 开源 /免费 工具 项 目 中 止 
的 风险 ; 不 能 支持 新 平台 的 风险 等 。 


6.3 组 织 内 引入 工具 


在 企业 或 组 织 内 引入 测试 工具 主要 包括 三 个 步骤 : 首先 ,根据 项 目 或 工作 需求 ,为 企 
业 或 组 织 选 择 合适 的 测试 工具 ; 其 次 ,所 选 测 试 工具 在 企业 或 组 织 内 进行 试用 (试点 项 
目 ); 最 后 ,在 企业 或 组 织 内 逐步 推广 工具 。 通 过 使 用 工具 去 不 断 地 学 习 和 掌握 工具 ,并 
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通过 观察 和 思考 不 断 地 完善 工具 的 使 用 ,同时 还 要 持续 关注 引入 工具 的 成 本 和 效益 比 。 


6.3.1 选择 工具 的 过 程 


选择 合适 工具 包括 如 下 几 个 步骤 。 

(1) 评估 实际 需求 : 在 项 目 或 工作 中 是 否 需要 工具 ,需要 什么 样 的 工具 等 。 

(2) 需求 规范 : 列 出 各 种 需求 并 根据 实际 情况 标 上 优先 级 。 

(3) 市 场 调查 : 在 互联 网 .行业 杂志 、 贸 易 展会 上 搜寻 测试 工具 ,并 做 出 初步 决定 。 

(4) 工具 演示 : 请 工具 提供 商 示 范 工具 的 使 用 ,并 最 好 能 针对 项 目 进行 演示 ,同时 请 
项 目的 技术 人 员 人 参与 演示 。 

(5) 列 出 可 选 工具 : 列 出 一 些 能 基本 满足 要 求 的 候选 工具 。 

(6) 工具 评估 : 对 所 列 工具 进行 全 面 评估 。 

(7) 选 定 工具 : 最 终 确定 选用 的 (试用 ) 工 具 。 

为 组 织 选 择 工 具 所 需要 考虑 的 关键 点 有 : 

(1) 评估 组 织 的 成 熟 度 、 分 析 引 入 工具 的 优点 和 缺点 和 认识 引入 工具 改善 测试 过 程 
的 可 能 性 。 

(2) 根据 清晰 的 需求 和 客观 的 准则 进行 评估 。 

(3) 适应 性 验证 ,在 评估 阶段 要 确认 在 现 有 的 情况 下 使 用 工具 对 被 测 软件 是 否 有 足 
够 的 效果 ,或 为 了 有 效 使 用 工具 ,目前 的 基础 设施 需要 如 何 改变 。 

(4) 评估 供应 商 (包括 培训 、 提 供 的 支持 及 其 他 商业 方面 的 考量 ) ,如 果 是 非 商业 人 性 工 
具 要 评估 提供 服务 的 供应 商 。 

(5) 为 了 在 工具 使 用 方面 得 到 更 好 的 指导 和 培训 ,需要 先 收集 内 部 需求 。 

(6) 评估 培训 需求 时 需要 考虑 现 有 测试 团队 的 资质 和 所 掌握 的 技能 。 

(7) 根据 实际 的 情况 估算 成 本 -收益 比 。 


6.3.2 被 选 工具 的 试用 一 一 试点 项 目 


将 已 经 选择 的 工具 引入 组 织 要 从 一 个 试点 项 目 开始 ,由 点 到 面 地 进行 推广 ,试点 项 
目 有 以 下 目的 。 

(1) 通过 试点 项 目 对 工具 有 更 多 的 认识 。 

(2) 评估 工具 与 现 有 的 过 程 以 及 实践 的 配合 程度 ,确定 哪些 方面 需要 作 修改 。 

(3) 定义 一 套 标准 的 方法 来 使 用 ,管理 ,存储 和 维护 工具 (例如 文件 和 测试 的 命名 规 
则 ,创建 框架 和 定义 模块 化 测试 套件 等 ) 。 

(4) 评估 在 付出 合理 的 成 本 后 能 否 得 到 预期 的 收益 。 

在 选择 试点 项 目 时 要 注意 不 能 选择 关键 和 重要 的 项 目 ,因为 新 工具 的 引入 本 身 就 有 
风险 ,可 能 会 因为 新 工具 的 引入 导致 项 目 无 法 按时 按 质 完成 ,给 企业 或 组 织带 来 损失 。 
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选择 的 试点 项 目 规模 也 不 能 太 小 ,否则 工具 的 很 多 功能 或 特征 无 法 被 充分 地 认识 和 验 
证 ,也 无 法 通过 试点 项 目 对 新 工具 进行 正确 的 评估 。 


6.3.3 工具 的 部 署 


工具 如 果 顺 利通 过 试点 项 目的 试用 ,可 以 在 组 织 内 逐渐 推广 。 在 企业 和 组 织 内 成 功 
部 署 工具 的 主要 因素 包括 : 

(1) 逐步 在 组 织 的 其 余部 分 将 工具 推广 到 测试 中 。 

(2) 调整 并 改进 过 程 来 配合 工具 的 使 用 。 

(3) 为 新 使 用 者 提供 培训 和 指导 。 

(4) 定义 使 用 指南 。 

(5) 实施 一 种 在 实际 运用 中 收集 工具 使 用 情况 的 方法 。 

(6) 监控 工具 的 使 用 和 收益 情况 。 

(7) 为 测试 团队 使 用 工具 提供 支持 。 

(8) 在 所 有 团队 内 收集 经 验 和 教训 。 


6.4 习题 


1.(K1) 将 选择 的 工具 引入 组 织 要 从 一 个 试点 项 目 开始 ,下 面 哪 一 个 不 属于 试点 项 
目的 目的 ? 〈 ) 
A. 通过 试点 项 目 使 得 对 工具 具有 更 多 的 认识 
B. 评估 工具 的 成 本 和 收益 是 否 合理 
C. 通过 试点 项 目 评价 员工 的 学 习 能 力 
D. 评价 工具 和 现存 的 过 程 以 及 实践 的 配合 程度 ,确定 哪些 方面 需要 作 修 改 和 完善 
2. 〈K1) 为 测试 执行 ,缺陷 跟踪 和 需求 管理 提供 接口 ,还 提供 对 数据 进行 定量 分 析 。 
它 还 支持 追溯 测试 对 象 到 需求 说 明 并 可 提供 独立 的 版 本 控制 能 力 或 提供 一 个 外 部 接口 。 
这 种 工具 是 ( Ne 
A. 测试 执行 工具 
B. 测试 管理 工具 
. 配置 管理 工具 
. 事件 管理 工具 
(K1) 以 下 不 属于 评审 工具 的 主要 作用 的 是 ( 汪 
对 代码 进行 度量 (例如 复杂 度 ) 可 以 帮助 计划 或 风险 分 析 
.存储 和 交流 评审 意见 ,缺陷 和 工作 报告 
.为 庞大 的 或 分 布 于 不 同 地 区 的 团队 提供 在 线 评审 
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D. 可 支持 评审 过 程 检查 表 ,评审 指导 方针 

4. (K1) 下 面 不 属于 使 用 工具 的 潜在 收益 的 是 ( ) 。 

A. 减少 重复 性 的 工作 

B. 更 好 的 一 致 性 和 可 重复 性 

C. 容易 得 到 测试 和 测试 的 相关 信息 

D. 不 用 考虑 不 同 工 具 之 间 的 关系 和 互 操作 性 

5. (K2) 为 组 织 选择 一 个 工具 所 需要 考虑 的 关键 点 有 哪些 ? ( ) 

(1) 评估 组 织 的 成 熟 度 (Maturity) 

(2) 分 析 引 入 工具 的 优点 和 缺点 和 认识 引入 工具 改善 测试 过 程 的 可 能 性 
(3) 根据 清晰 的 需求 和 客观 的 准则 进行 评估 

(4) 对 工具 提供 商 进行 评估 

(5) 确定 在 工具 使 用 方面 应 提供 的 指导 和 内 部 培训 需求 

(6) 评估 培训 需求 时 需要 考虑 现 有 测试 团队 的 自动 化 测试 技能 

(7) 根据 实际 的 情况 估算 成 本 -收益 比 

A. (2),(3),(4),(5) 

B. KLyC2)3C6) 

C. Cia (5 0m 
DBD CI CoC3) 45) 6% 7 
6.(K1) 通 过 动态 分 析 工 具 比 较 容易 发 现下 面 的 哪个 问题 ? ( ) 
A. 控制 流 问题 

B. 数据 流 问 题 

C. 内 存 泄漏 

D. 编码 规范 问题 

7.(K1) 下 列 关于 测试 管理 工具 的 描述 ,哪个 是 不 正确 的 ? ( ) 

A. 管理 程序 的 代码 文档 

B. 管理 和 跟踪 测试 用 例 

C. 管理 和 跟踪 测试 执行 进度 

D. 管理 各 种 测试 文档 

8.(K1) 测 试 人 员 采 用 测试 工具 进行 动态 测试 .下 面 的 哪个 论点 是 正确 的 ? 〈 
A. 测试 对 象 必须 全 部 或 者 部 分 可 以 运行 

B. 测试 对 象 必 须 是 通过 V 模型 开发 的 

C. 测试 对 象 必须 完成 了 组 件 测 试 

D. 测试 对 象 必须 通过 了 验收 测试 

9.〈K1) 组 织 中 引入 测试 工具 .下 面 哪些 因素 是 需要 考虑 的 ?( 

. 测试 工具 的 购买 价格 

b. 测试 工具 的 维护 成 本 
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测试 人 员 学 习 工 具 的 成 本 
测试 工具 与 其 他 工具 之 间 的 兼容 性 


[= 
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